LRI [/ 
ELP SEL [/ 
ERNEK a ll ERRE E 
——S LT 


BÁLINT ÁGNES 

TÁTRAI FERENC 
STATISZTIKAI 
SZÁMÍTÁSOK 
ehhe e 


ha 
hár 
A! 
Mi 
ha 
e 


777111 


áz elaeteteetetetetetetaleta 


BÁLINT ÁGNES — TÁTRAI FERENC 


Statisztikai eljárások 
Commodore 64-esen 


Novotrade, 1989 


Lektorálta: Soltész Péter 
Dr. Veress Gábor 


A programok kidolgozásában részt vett: 


Répás Zsuzsanna 


Kiadásért felel RÉNYI GÁBOR, a Novotrade Rt. vezérigazgatója 
Budapest, 1989 


Műszaki szerkesztő: Erdősi Zoltán 


Készült a Szegedi Nyomdában (13 A/5 ív) 
Felelős vezető: SURÁNYI TIBOR igazgató 


ISBN 963 585 003 4 


Copyright €) Dr. Bálint Ágnes, Dr. Tátrai Ferenc, 1989 


TARTALOMJEGYZÉK 


EIŐSZÓ  RAJÉMÉNDÉZKÁNÉGÉSA ÁmÉrbnb SOR ÁKNÉSNZÉ S ÉN ÉLES G yt íz 

Útmútató könyvünk használatához  sssssesessemménesésész eme ság sáv áeiáa éássszetue ékes 9 

1. A programcsomag felépítésé ÉGIMMŰKÖJÉSE szszzzüz és rez eMeN aba 4 Bé els erdő pb ések 11 

2. Valószínűségszámítási alablóbá lak úeeemesameesáumógésáék atddtsetátáyzé ére a má látás ösze ke tge áéár ék 17 

4 A YÓlEtENTOSÁNNA ezé mezüsa sírásás átgazzáké sé nk ante rártésáparb Ét etgászeztts észt 17 

2.2. A valószínűség axiómái, valószínűségeloszlás, VAlÓSZÍTŰSÉLLÍNEZŐ ezér eg üressége 18 

2é8 MÁLNATÓTÉNTÉK SZOKÁS  erzéezüeréts b ése elt mü ér ekét e MR GÉ árt ÉLEN TTL EÜ LAS TÉSÉK E ég hő 21 

2.4. Fontosabb eloszlások KÓGENS NÉ TÖá ág gl álzók SKÉNT Ste gr Ég NVAÁGTEGE BT KETÜKÉTETÉ ÉN ÉG LGSTÓ TÁNÉZÉTŐÉK DET ÉNE ÚN 23 

ZU. TDISZKTELSIOSZÍÁSOK  sünándsez tte kkyzaán sáv Égeeá SÓ gyágáorzkeitát énő str át ís GGV DÁN Zé Téta arte 23 

242. Eölytotios eloszlásólk üreééásiszéktátéésenté Zára tés tzesrágrsti zóló ala tető táskák tiggeteseás hévisvia 28 

3. Matematikai statisztikai alapfogalmak s ezazmaesa mem eire a aa Ete tletezat án ata Tegye éne été 41 

3.1 JALStATSZTKAVSOKASÁR HANNTA.  szétéretete ez érése bé Eg dé E tik eler hl ez kédee egg hl E ÉLÉNENN ÉSÉT HÁLT 41 
3.2. A minta feldolgozása: (rendezett minta) osztályközökbe sorolás, a gyakoriságok és 
Hélatív GYAKONSÁSOK KISZÁMÍTÁSA. üzeetsbő sttdneszánnne ől ára e ítás e nanktt áros gaápáddözésá rgyéai ay áró 

3.3. A minta jellemzése (középértékek, tapasztalati szórás) ...... . . . . GYANTÁT TÁKNÁÁKÁ Egg ék nát gÉs 48 

4. Statiszülkal PTÓDÁK ezető temet ehe ne kk rés Kedes keves ARE E ELLE AEK E hé ÉS ÉS 58 

2.1. A statisztikai Próbákról Általában s szezüsénaák szezsétmezésus elekozyürébe zén elt dankkáy aze igvé tem ésó 53 

42. FÜESEtlenségVIZSSÁlat 4 BEÓDÁVAL s eset égessen ék ót isprlstesekáétslkatántós ké ete szerloöntletó tágra tkaltént fvédlssétán ágát 55 

65. INOPMALTASVIZSSATÁL áévéretátsszrra életeket zetése ták driés tés ény NÉK ÉKE ÉN MÉ ÉSGGL B IOÁÉG NK ÉTESNE KSS ÉKE GÁT ÉS 60 

4.4. A várható érték vizsgálata az u és t statisztika használatával ...................... 67 

441. EGYHUNTÁSTÜZDTÓBA  jetoketáat zárásáez mé 2 etetett sé Toto ő zet LE Ál a AZÉ ÉR KÉNE E 68 

22 IRÉTTMNTÁS US DTÓDA érzékét árra été Edna KÉS Ü Tb TETE ÖEEGÉKSK Eg ZONE 70 

443. TBEVTNTÁS ÍGDTÓDA . eztetet sás öbe övével egre adlzző ete ánétsz ések bát PANE KÉNEÜ ÉS Agy s kel vatékjzöÉgK 73 

444. Kétmintás tpróba és Weélch-DTÓDA: ass eeazvszeekszáseáse e s gvzánérásys ata netésjjes drárárzesstás 75 

445. Koönfidenciá intervállúmm KÍZETŐLÉSE s sszéss ess trészneánszésérívesáréjáre aváráriskerarazáranásláesát été sávávárts VÁ 

4.5. SZÓHÁSOKZÓSSZEDASOMÍÍTÁSA sas ersz éívásénéltégisatér vigye énióts törve eZELéy erőt er árárts KLÁN Ag áaá gy gőlÁnE 82 

4.5.1. Két szórás összevetése: F-próba (FishetGpróbá) s esmsaze ess seemeseázájtes ém ő 4 82 

4.5.2. Több szórás egyezésének vizsgálata: Bartlett-próba ......................... 83 

SL ISZOTÁSSÍGTTZÉST " öró önző estetek ELET 1ÁtápszegyűN TÉL  rÉÉ EN ÉNEKLŐ ÉN ÉKE KEK EKE) SÉT É S SG SO E ÖN det édtégl s 89 

5.1. Szóráselemzés egyszeres osztályozással 2... szssssesesesevesess eéáess set aaa esés 91 

5.2. Szóráselemzés kétszeres osztályozással .................. ÉL és it gztageó áz ÉG élét zá sí 95 

6. Regresszió:és körrelációszámíútás (Sgörbeillesztés) ezesásározsjáslétedaáás ae drévestszsáusn fasá ké áé 101 

1. Egyváltozós lineáris regresszió a legkisebb négyzetek módszerével .................. 102 

6.2. Egyváltozós lineáris regresszió a független változó vagy a függvény transzformálásával . 111 

6.3. Többváltozós lineáris regresszió ENEZELZATÉL ÉS TÁS JÉÉ EE ÉVÁT RAL RÁTÁLÉK SK ÉSEL TÁ ÜNNÍ STEG ZÓNZÁG KÜ 118 

6.4. Többváltozós lineáris regresszió a változók transzformációjával .................... 121 

65. A korrelációs atát riXISZÁMÍTÁSA ret ár áttérés ésére ne HIP E JE SNEán ÁE AVNE VTK élje Öö EE ÉKE 128 

7. Az adatkezelő DTÓSTÁHMÓ  súszeömeg se tegez zkássíkáó úré ds e ee ára zzloantÁ totál sena áz elnga tető 131 

INTEMEKTG ÜK : öreátéténtézátétékétenepeétesáltézt E mint KÉN ELÉ Ez ZSELÉ ÉNŐ ÉSÉT RS Na SEL a ZER ENYZÉT ENNE Ű GES 139 


ELŐSZÓ 


Egy hazai, statisztikával (is) foglalkozó tekintélyes professzorunk így kezdte első 
előadását: 
, Jelenlegi ismereteink szerint a hazugság 3 kategóriája létezik : 


— kis hazugság, 
— nagy hazugság, 
— statisztika." 


Valóban, a statisztika tudományával akarva-akaratlanul sokan visszaéltek már. 
Mindezen visszaélések természetesen nem a statisztika eredendő bűnei: a statisztika 
, avatott" használatával döntéseink, helyzetünk és a változások trendjének megítélése 
megalapozottabb, biztosabb lehet. 

A statisztika, a statisztikai módszerek ma már számítógépes kultúránk szerves 
részévé váltak. 

A Novotrade Rt. gondozásában 1986-ban megjelent Voss professzcr kitűnő könyve, 
a Bevezetés a statisztikai számításokba C 64-esen. Ez a könyv számos, igen értékes 
alapfokú statisztikai eljárás BASIC nyelvű programját tartalmazza. Jelen könyvünk 
megírásával nem a statisztikai témakörben megjelenő művek számát kívántuk eggyel 
szaporítani. Könyvünk alapjaiban eltér Voss könyvétől, de egyszersmind annak 
folytatásaként is felfogható. 

Először is e könyvben a hangsúlyt nem a statisztikai módszerek programozásának 
részleteire fektettük, hanem a mélyebb statisztikai tartalomra. Könyvünk közép- 
fokúnak mondható. Nem az a célunk tehát, hogy a C 64-es kezelésében járatos 
Olvasót saját céljainak megfelelő, statisztikai programok készítésére tanítsuk meg, 
hanem kész programokat bocsátunk az Olvasó rendelkezésére, amellyel statisztikai 
adathalmaza feldolgozásával kapcsolatos kérdéseire választ tud kapni. 

A könyv megírásakor olyan felhasználót tekintettünk , modellnek", aki nem akar 
programozási munkával bíbelődni, a munka érdemi részével szeretne törődni. Van- 
nak már adatai (ezeket méréssel, kérdőíves feldolgozással vagy bármilyen más adat- 
gyűjtési módszerrel szerezhette), és most minél kevesebb felesleges munkával szeretné 
az adataiban rejlő információkat megismerni, és ennek alapján esetleg döntéseket 
hozni. Természetesen nem sajnálja az időt a statisztikai tartalom megismerésére: 
nem akar téves döntéseket hozni. Milyen döntésekről van itt szó? A teljesség igénye 
nélkül felsorolunk néhány tipikus statisztikai döntési helyzetet. 

I. Mezőgazdasági szakemberünk egy búzaszállítmány átvételéről vagy visszakül- 
déséről akar dönteni. Laboratóriumi mérésekkel, véletlen minták alapján ismeri a 
búza minőségi jellemzőinek átlagértékét és szórását, és főnökei meghatározták ezen 
jellemzők előírt értékeit. Az előírt és mért jellemzők természetesen eltérnek egymástól. 
Ha a szállítmányt átveszi, de a búza minősége rossz, megbüntetik. Ha nem veszi át, 
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de a szállítmány mégis jó volt, vállalatának kárt okozott: álltak a takarmánykeverő 
gépek, a szállító pereskedik stb. Hogyan döntsön? 

II. Egy környezetvédelmi előadó szennyvízbírságot akar kiróni termelőszövetkeze- 
tünkre, mert a közeli folyó vizének foszfáttartalma meghaladja a megengedettet. 
Ezt természetesen nem folyamatos méréssel, hanem adott számú mintából állapította 
meg. Saját méréseink mást mutatnak. A mérési módszer szórása és a két mérés 
átlagának eltérése ismert. Reménykedhetünk-e benne, hogy az eltérés csak a véletlen 
műve volt, és új ellenőrzést kérve, megússza szövetkezetünk a büntetést, vagy jobb, 
ha nem szólunk egy szót sem, nehogy növekedjék a bírság? 

III. Egy állami gazdaság két tehenészetében 15-15. tehén tejét elemezve a tej 
zsírtartalma kismértékben eltér. A mérési módszernek természetesen van szórása, 
a mért értékek is bizonyos szórást mutatnak. Hány tehén tejét kell megvizsgálnunk 
ahhoz, hogy az ismert korlátokkal rendelkező mérések alapján az egyik istállóban 
adott takarmányt jobbnak ítélhessük a másiknál? 

IV. Színhelyünk egy épületkerámia-gyár. Tudjuk elméleti megfontolásokból, hogy 
a fagyálló padlólap égetés közben bekövetkező zsugorodása a felhasznált agyagkeve- 
rék számos tulajdonságától függ: 

— az agyagásvány kalcium/alumínium arányától, 

— az agyagkeverék nedvességtartalmától, 

— az előszárítás hőmérsékletétől és időtartamától stb. 

Az agyagkeverék ismert tulajdonságai alapján szeretnénk megállapítani a várható 
zsugorodást, hogy ennek függvényében tudjuk a formázó automatán a kipréselendő 
lapok méretét beállítani. Ehhez szükség van az említett változók és a zsugorodás 
közötti függvénykapcsolat megkeresésére és a függvény állandóinak kiszámítására. 
A függvény konstansai azonban függenek a későbbi égetés , szigorúságától", azaz 
hőmérsékletétől, idejétől stb. Ezért időről időre újra meg kell azokat határozni. 
Ez a feladat számítógépes paraméterbecslést igényel (a regressziós egyenlet para- 
métereinek becslését). 

Könyvünk és a benne levő programcsomag ilyen és ehhez hasonló kérdésekre 
adja meg a választ. A programcsomag felépítése olyan, hogy a felhasználó a program 
által feltett kérdésekre adott válaszokkal ki tudja választani a számára megfelelő 
programot, sőt az eredményeket is értelmezni tudja. 

A könyv fejezetei egymásra épülnek. Alkalmas középfokú statisztikai tanfolyamok 
segédkönyveként éppúgy, mint egyéni tanuláshoz, vagy a benne levő programok 
futtatásával konkrét problémák megoldására. 


ÚTMUTATÓ KÖNYVÜNK 
HASZNÁLATÁHOZ 


Könyvünk első fejezetében ismertetjük a statisztikai programcsomag felépítését és 
használatát. A további fejezetekben az egyes programok matematikai statisztikai 
tartalmával ismertetjük meg az Olvasót. 

A különböző fejezetekből kiderül, hogy az egyes programok milyen kérdés, ill. 
probléma megválaszolására alkalmasak. Az elméleti ismereteken kívül a fejezetek 
mindegyike tartalmaz mintapéldát is, amelyeket az első fejezetben bemutatott prog- 
ramcsomag segítségével meg is oldottunk. 

A programcsomag felépítését ismerő olvasó számára tehát világosak lesznek a 
különböző fejezetekben előforduló, sokszor ismétlődő felszólítások, mint pl.: , Vá- 
lasszuk ki a FŐMENÜ-ből az ELOSZLÁSOK menüt!" vagy pl. , Hívjuk be az 
ELOSZLÁS MENÜBŐL a Poisson eloszlás programját!" stb. 

Minden bemutatott példánál közöljük a program által számított eredményt, ill. 
eredményeket, és ahol szükséges az eredmények magyarázatát is megadjuk. 


Hogyan kell tehát használni ezt a könyvet? 


Egyéni tanulás, a statisztikai alapismeretek elsajátítása és gyakorlása a könyv 
segítségével 


A továbbiakban feltételezzük, hogy az Olvasó ismeri a Commodore 64-es és a 
lemezmeghajtó egység használatát, legalábbis képes behívni a lemezről a programo- 
kat LOAD paranccsal és azokat el tudja indítani a RUN paranccsal. Ez esetben 
először célszerű a gép mellett ülve elolvasni a programcsomag ismertetését tartalmazó 
első fejezetet, és mindjárt be is hívni a főmenüt, majd az egyes almenüket. Az al- 
menük utolsó ágán visszatérhetünk a FŐMENÜC-höz. Ezzel képet kaphatunk a 
feldolgozott, elméleti alapokkal is alátámasztott anyagról. Ne indítsuk el egyelőre 
egyik részprogramot sem, csupán azt nézzük át, hogy az egyes programok (menü- 
ágak) milyen részfeladatok megoldását kínálják. 

Ezután olvassuk el az adatkezelést leíró fejezetet. Ezt a statisztikai anyagtól el- 
különítve, a könyv utolsó fejezete tartalmazza. Megértése nem kíván statisztikai 
alapismereteket, de mivel a statisztikai adatfeldolgozás során általában nagyobb 
adathalmaz ismételt feldolgozásáról van szó, célszerű adatainkat egyszer s minden- 
korra felvinni a mágneslemezre, és a továbbiakban onnan lekérdezni. Sokat segít- 
het a tanulásban, ha az Olvasó az egyes fejezcickben közölt futtatási eredményeket 
csak akkor nézi meg, amikor a mintapéldát már önállóan (természetesen nem kézi- 
számítással, hanem az idevonatkozó program lefuttatásával) megoldotta. A kapott 
és az általunk közölt eredmények összehasonlítása hasznos tanulságokkal járhat. 


A könyv használata statisztikai tanfolyamok oktatási segédleteként 


Saját oktatási tapasztalataink azt mutatták, hogy a , száraz" statisztikai ismere- 
tek oktatásában a példák megoldásának nagy meggyőző ereje van. A legtöbb sta- 
tisztikai példa megoldása azonban egyszerű, ám sokszor ismétlendő számtani mű- 
veletek elvégzését igényli. Ez az előadásokat kellemetlen módon széttördeli, elvész 
az eredeti, megértetni kívánt gondolatmenet. Könyvünkben ezt úgy próbáltuk át- 
hidalni, hogy az előadandó elméleti anyagot rögtön követi a példa megoldása. 
Az eredmény a demonstrációs eszközként használt számítógéppel a képernyőre 
másodpercek töredéke alatt kiírható, sőt a sornyomtatón kiírt eredményekből 
minden hallgatónak adhatunk. Ezt a demonstrációt elősegíti, hogy az elméleti is- 
mertetőben és a programban ugyanazokat a szakkifejezéseket használjuk, így nem 
kell , lefordítani" a számítógép által kiírt eredményeket. 


A könyv használata statisztikai számítások megoldásában 


Tételezzük most fel, hogy az Olvasó tisztában van a könyvben feldolgozott sta- 
tisztikai fogalmakkal, és konkrét, napi problémáiban akarja a könyvet és a progra- 
mot felhasználni. Ez esetben azt javasoljuk, hogy az egész programot ismertető 
első fejezet és az adatkezelést ismertető fejezet elolvasása után vegye fel adatait 
mágneslemezre, és keresse meg azt a menüágat, amely feladatai megoldására alkal- 
mazható. Ha a módszer lényegével tisztában vagyunk, a megfelelő program kivá- 
lasztása, futtatása és az eredmények értékelése nem okozhat gondot. Mágneslemezen 
tárolva az adatokat egyszerűen válogathatunk, módosíthatunk, ill. bővíthetünk stb. 
adatállományunkban. 

Két jótanács: A programok legelső futtatása előtt írassuk ki a programismertetőt 
a képernyőre. Adattárolásra külön mágneslemezt használjunk. 


A programcsomag továbbfejlesztése 


A könyv minden fejezete tartalmazza a vonatkozó program ismertetését, a változók 
listáját és a programlista , izgalmas"? részeit. Ezek alapos átnézése lehetőséget ad a 
program bővítésére, hiszen minden speciális feladat megoldására programunk nincs 
felkészítve, nem is lehet. Javasoljuk azonban, hogy programmódosítással csak az 
próbálkozzon, aki járatos a BASIC programozásban, és a statisztikai módszerek 
használatában is. 


Könyvünk használatához sok sikert kívánunk. 


A szerzők 
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1. A PROGRAMCSOMAG FELÉPÍTÉSE 
ÉS MŰKÖDÉSE 


A programokat BASIC nyelven, Commodore 64-es típusú számítógépre írtuk. 
A könnyebb használhatóság és együttes kezelhetőség érdekében a programokat 
programcsomaggá szerveztük. 

A programcsomag összeállításánál törekedtünk az interaktivitásra, így a prog- 
ramok futtatása azok számára sem okoz gondot, akik kevéssé járatosak a statisztiká- 
ban és a programozásban. Valamennyi programot párbeszédes üzemmódban készí- 
tettük, sőt, néhol külön interaktív programok segítik a megfelelő programok kivá- 
lasztását. Ilyen például az INTERAKT ÍV PROGRAM A MEGFELELŐ STA- 
TISZTIKAI PRÓBA KIVÁLASZTÁSÁRA című, amellyel az is könnyen eldönt- 
heti, melyik statisztikai próbát kell alkalmazni az adott esetben, aki nem ismeri 
ezeket a próbákat. 

A felhasználónak valamennyi programban kérdésekre kell válaszolnia, így viheti 
be az adatokat, választhatja ki a megfelelő menüágat vagy írathatja ki az eredményt. 

A felhasználónak csak a FŐMENÜ című programot kell behívnia és elindítania, 
ezután maga a FŐMENÜ program hívja be azt a programot, amelyet kiválasztot- 
tunk, majd a program lefutása után visszatér a FŐMENÜ-re. Ha behívjuk és el- 
indítjuk a FŐÖMENÜ című programot, akkor a következő felirat jelenik meg a 
képernyőn: 


FŐMENÜ 
STATISZTIKAI PROGRAMCSOMAGHOZ 
AZ ALÁBBI LEHETŐSÉGEK KÖZÜL VÁLASZTHAT: 


ADATFILE MŰVELETEK (1) 
ALAPVETŐ STATISZTIKAI JELLEMZŐK . (2) 
ELOSZLÁSOK 3) 
STATISZTIKAI PRÓBÁK (4) 
SZÓRÁSELEMZÉS — (5) 
REGRESSZIÓSZÁMÍTÁS (6) 
VÉGE 0 


Vegyük sorra, mi történik, ha az egyes menüágakat választjuk! Bármely választás 
esetén, a program először is azt kéri, hogy tegyük be a lemez megfelelő oldalát, a 
programcsomag ugyanis két lemezoldalon található. Ha az ADATFILE MŰVELE- 
TEK-et választottuk, a program behívja az adatfeldolgozó programot. 

Mivel a statisztikai programokkal általában igen sok adatot dolgozunk fel egy- 
szerre, célszerű azokat háttértárolón rögzíteni és előkészíteni. Az adatfile-okat a 
programcsomag valamennyi programja használja, ill. használhatja, fontosságára 
való tekintettel az ADATFILE MŰVELETEK programot a fejezet végén külön 


Ti 


. 


pontban a többinél részletesebben ismertetjük. Ha az ALAPVETŐ STATISZTIKAI 
JELLEMZŐK-et választottuk a következőket láthatjuk a képernyőn : 


ALAPVETŐ STATISZTIKAI JELLEMZŐK 
AZ ALÁBBI LEHETŐSÉGEK KÖZÜL VÁLASZTHAT: 


ÁTLAG-, MEDIÁN- ÉS SZÓRÁSSZÁMÍTÁS 1) 
MINTAFELDOLG. OSZTÁLYBA SOROLÁSSAL (2 
VISSZA A FŐMENÜHÖZ (3) 


(Az osztályozás a könyvben szűkebb értelemben a minta elemeinek számszerű 
tulajdonságok szerinti csoportosítását jelenti. A mennyiségi osztályok alsó és felső 
határértékkel rendelkeznek, a kettő különbsége az osztályköz (osztásköz).) 

Hivassuk be az átlag-, medián- és szórásszámító programot! Először a program 
címe jelenik meg, majd kívánság szerint kiírathatjuk az ismertetést. A program 
ezután az adatokat kéri, és azokat igény szerint lemezről (ha előzőleg rögzítettük) 
vagy billentyűzetről olvassa be. Ha ez megtörtént, a program kiszámítja a szám- 
tani, mértani, harmonikus, négyzetes és logaritmikus átlagot, a mediánt, a korrigált 
tapasztalati szórást és a szórásnégyzetet. Az eredmények kiírása után újabb ada- 
tokkal ismételhetjük meg ugyanezt vagy visszatérhetünk a FŐMENÜ-höz. 

Ez a program azért nagyon hasznos számunkra, mert a statisztikai próbákat 
végző programokban lehetőség van arra, hogy ne a teljes adatsort, hanem csak a 
már előre kiszámított átlagot és szórást vigyük be. Ez nagymértékben megkönnyíti 
és meggyorsítja munkánkat és csökkenti a helyfoglalást a belső tárban. 

Most hívassuk be a MINTAFELDOLGOZÁS OSZTÁLYBA SOROLÁSSAL 
című programot! A cím és az ismertetés kívánság szerinti kiíratása után az adatokat 
kéri a program, amelyeket lemezről is, billentyűzetről is bevihetünk. Ezután nagy- 
ság szerint sorba rendezi az adatokat és kiírja, melyik a legkisebb és a legnagyobb 
elem, megkérdezi, hány osztásközbe kívánjuk sorolni az adatokat, majd kéri az 
osztásközök felső határát. Az osztályba sorolás után lehetőség van a javításra, majd 
a menü jelenik meg a képernyőn, ahol kérhetjük a gyakorisági táblázat kiírását, 
a módusz kiszámítását, a tapasztalati eloszlásfüggvény, ill. a hisztogram felrajzolá- 
sát vagy kiléphetünk a programból. Bármely menüágat választottuk, utána ehhez a 
menühöz tér vissza a program. 

Ha a FŐMENÜ-ben az ELOSZLÁSOK című menüágat választottuk. a követ- 
kezőket láthatjuk a képernyőn : 


ELOSZLÁSOK 
AZ ALÁBBI LEHETŐSÉGEK KÖZÜL VÁLASZTHAT: 
DISZKRÉT ELOSZLÁSOK : 


BINOMIÁLIS ELOSZLÁS 1) 
POISSON ELOSZLÁS (2) 
FOLYTONOS ELOSZLÁSOK : 
NORMÁLIS ELOSZLÁS — 8) 
EXPONENCIÁLIS ELOSZLÁS (4) 
KHI-NÉGYZET ELOSZLÁS (5) 
STUDENT ELOSZLÁS (6) 
FISCHER ELOSZLÁS (7) 
ELOSZLÁSFÜGGVÉNYEK KIRAJZOLÁSA (8) 
VISSZA A FŐMENÜHÖZ 9) 
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Itt az ELOSZLÁSFÜGGVÉNYEK KIRAJZOLÁSA kivételével valamennyi prog- 
ram azonos módon épül fel, ezért ezeket együtt ismertetjük. A programok elején 
kérhetjük az ismertetés kiírását, majd meg kell adni az eloszlás paramétereit és a 
valószínűségi változó értékét (ezek helyességét a program ellenőrzi). Ezután kiszá- 
mítja az ehhez tartozó valószínűséget (normális eloszlás esetén az eloszlás- és a 
sűrűségfüggvény értékét), majd kiírja a képernyőre. Lehetőség van arra, hogy más 
értékekkel megismételjük a számolást. 

Ha az ELOSZLÁSFÜGGVÉNYEK KIRAJZOLÁSÁC-t választottuk, az előbbi 
diszkrét eloszlások hisztogramjait, ill. a folytonos eloszlások eloszlás- és sűrűség- 
függvényeit rajzolhatjuk ki a képernyőre vagy a nyomtatóra. A program alapján a 
menüből kell kiválasztani az eloszlást, majd a felrajzolás után ide térünk vissza, 
hogy újabb eloszlásfüggvény felrajzolását kérjük, vagy kilépjünk a programból. 

Ha a FŐMENÜC-ben a STATISZTIKAI PRÓBÁK című menüágat választottuk, 
a következő jelenik meg a képernyőn: 


STATISZTIKAI PRÓBÁK 


AZ ALÁBBI LEHETŐSÉGEK KÖZÜL VÁLASZTHAT: 
A MEGFELELŐ PRÓBA INTERAKTÍV 


KIVÁLASZTÁSA j 1) 
U STATISZTIKA HASZNÁLATA (2) 
T STATISZTIKA HASZNÁLATA (3) 
F-PRÓBA ÉS BARTLETT-PRÓBA (4) 
FÜGGETLENSÉGVIZSGÁLAT 
KHI-NÉGYZET PRÓBÁVAL (5) 
NORMALITÁS VIZSGÁLAT 
KHI-NÉGYZET PRÓBÁVAL (6) 
VISSZA A FŐMENÜHÖZ (7 


A MEGFELELŐ PRÓBA INTERAKTÍV KIVÁLASZTÁSA című programot 
már az előbb említettük. Ez a program kérdések feltevésével segíti a problémánkra 
választ adó statisztikai próba kiválasztását, és be is hívja a kiválasztott progra- 
mot. 

Az U STATISZTIKA HASZNÁLATA című program a várható értékekre vo- 
natkozó hipotézis vizsgálatát végzi el, amennyiben ismerjük a szórást. Először a 
menü jelenik meg, ahol választhatunk, hogy egy- vagy kétmintás próbát akarunk-e 
végezni, az ismertetést szeretnénk-e elolvasni vagy ki szeretnénk lépni a programból. 
Ezután az adatokat kéri a program, amelyeket természetesen itt is akár lemezről, 
akár billentyűzetről is bevihetünk. Ha billentyűzetről visszük be az adatokat vá- 
laszthatunk, hogy a teljes adatsor(oka)t akarjuk-e beolvasni vagy a már előre ki- 
számított átlago(ka)t. 

Ezután következnek a számítások. Ha az egymintás u-próbát választottuk, meg- 
jelenik az egymintás u-próba almenüje, ahol a következő lehetőségeink vannak: 
az u-érték kiszámítása, a megbízhatósági intervallum kiszámítása, a mérések szá- 
mának meghatározása, visszatérés a program főmenüjéhez vagy kilépés a program- 
ból (visszatérés a FŐMENÜ programhoz). A számítások elvégzése után mind az 
egymintás, mind a kétmintás változatnál a program megkérdezi, hogy egyoldali 
vagy kétoldali hipotézisről van-e szó, és hogy hány százalékos megbízhatósági 
szintet választunk, majd kiírja az eredményt. Ezután visszatérünk a menühöz (ha 
egymintás próbát számoltunk, akkor az egymintás próba almenüjéhez, ha kétmintás 
próbát számoltunk, akkor a program főmenüjéhez). 
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A T STATISZTIKA HASZNÁLATA című program szintén a várható értékekre 
vonatkozó hipotézist vizsgálja abban az esetben, ha nem ismerjük az elméleti szórá- 
sokat. A program hasonlóképpen épül fel, mint az EGY- ÉS KÉTMINTÁS U- 
PRÓBA. Az elsőként megjelenő menüben a következő lehetőségek közül választ- 
hatunk: egymintás t-próba, kétmintás t-próba, Welch-próba, az ismertetés kiíra- 
tása, kilépés a programból. Az adatbevitelre ugyanazok a lehetőségek, mint az u-pró- 
bánál. Az egymintás t-próba almenüje megegyezik az egymintás u-próbáéval. Ez a 
program is megkérdezi, hogy egyoldali vagy kétoldali hipotézisről van-e szó, és hogy 
hány százalékos megbízhatósági szintet választunk. Az eredmény kiírásának módja, 
majd a további lépések megegyeznek az előző programnál leírtakkal. 

Az F-PRÓBA ÉS BARTLETT-PRÓBA című program a szórások egyezését 
vizsgálja, két és több változó esetén. Először szintén a menü jelenik meg, ahol -vá- 
laszthatunk, hogy F-próbát vagy Bartlett-oróbát akarunk-e végezni, az ismertetést 
akarjuk-e kiíratni vagy ki szeretnénk lépni a programból. Ezután az adatokat kell 
bevinni, a teljes adatsort vagy a már kiszámított szórásokat. A program nemcsak 
az F-értéket, ill. a 72 értékét számítja ki, hanem az azokhoz tartozó szignifikancia 
szintet, ill. valószínűséget is. Az eredmények kiírása után a menüre térünk vissza. 

FÜGGETLENSÉGVIZSGÁLAT KHI-NÉGYZET PRÓBÁVAL olyan vizsgá- 
lat, amelyben arra a kérdésre keresünk választ, hogy két vagy több esemény való- 
színűsége megegyezik-e. A program legelején kívánság szerint kiírathatjuk az ismer- 
tetést, majd az adatokat kell bevinnünk. Az adatokat ebben az esetben az ún. kon- 
tingencia-táblázat tartalmazza. Ezután következnek a számítások, az eredmények 
kiíratása, majd újabb számítást végezhetünk vagy visszatérhetünk a FŐMENÜ-re. 

Ha a NORMÁLI1 "ÁSVIZSGÁLAT KHI-NÉGYZET PRÓBÁVAL című prog- 
ramot választottuk, arra a kérdésre kaphatunk választ, hogy egy adott adatsor 
normális eloszlású-e. Az esetleges ismertetés kérése után következik az adatok 
bevitele. Lehetőségünk van a teljes adatsor előkészítés nélküli bevitelére is. Ebben 
az esetben a program nagyság szerint sorba rendezi az adatokat, kiírja melyik a 
legkisebb és legnagyobb elem, majd megkérdezi, hány osztályközbe akarjuk sorolni 
az adatokat, és kéri az osztályközök felső határait. 

Lehetőség van arra is, hogy már osztályba sorolt adatokat vigyünk be, de akkor 
is meg kell adnunk az osztályközök felső határait és az egyes osztályközökhöz tar- 
tozó gyakoriságokat, valamint az átlagot és a SZÓTÁSt. Ezután következnek a szá- 
mítások, majd az eredmény kiíratása. Nemcsak a X? értékét írja ki a program, ha- 
nem a hozzá tartozó valószínűséget is. Lehetőség van újabb normalitásvizsgálat 
elvégzésére vagy visszatérhetünk a FŐMENÜ programra. Ha a FŐMENÜ-ben 
a SZÓRÁSELEMZÉS című menüágat választottuk, a következő jelenik meg a 
képernyőn: 


SZÓRÁSELEMZÉS —— j 

Az ALÁBBI LEHETŐSÉGEK KÖZÜL VÁLASZTHAT: 

INTERAKTÍV PROGRAM A MEGFELELŐ 
ALPROGRAM KIVÁLASZTÁSÁRA 4) 

SZÓRÁSELEMZÉS EGYSZERES OSZTÁLYOZÁSSAL (2 

SZÓRÁSELEMZÉS KÉTSZERES OSZTÁLYOZÁSSAL (3) 

VISSZA A FŐMENÜHÖZ (4 


Az INTERAKTÍV PROGRAM A MEGFELELŐ ALPROGRAM KIVÁLASZ- 
TÁSÁRA című program rövid magyarázattal segítséget nyújt a megfelelő program 
kiválasztására, és be is hívja azt. 

A SZÓRÁSELEMZÉS EGYSZERES OSZTÁLYOZÁSSAL és SZÓRÁSELEM- 
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ZÉS KÉTSZERES OSZTÁLYOZÁSSAL című programok felépítése gyakorlatilag 
megegyezik. Mindkét programban először ismertetést kérhetünk, majd az adatokat 
kell bevinnünk, amit lemezről is, billentyűzetről is megtehetünk. Ezután következ- 
nek a számítások, majd az eredmény kiírása. A program kiírja a szórásfelbontó 
táblázatot és az F-értéket is, majd újabb elemzést végezhetünk vagy visszatérhetünk 
a FŐMENÜ programra. Ha a FŐMENÜ-ben a REGRESSZIÓSZÁMÍTÁS című 
menüágat választottuk, a következőket láthatjuk a képernyőn : 


REGRESSZIÓSZÁMÍTÁS 


AZ ALÁBBI LEHETŐSÉGEK KÖZÜL VÁLASZTHAT: 
INTERAKTÍV PROGRAM A MEGFELELŐ 


ALPROGRAM KIVÁLASZTÁSÁRA 4) 
EGYVÁLTOZÓS REGRESSZIÓ: 
LINEÁRIS — 2) 
EXPONENCIÁLIS (3) 
GEOMETRIAI (4) 
LOGARITMIKUS (5) 
ANTOINE-TÍPUSÚ — (6) 
N-ED RENDŰ HATVÁNYSORRAL 

VALÓ KÖZELÍTÉS (7) 


TÖBBVÁLTOZÓS LINEÁRIS: 
A. VÁLTOZÓK TRANSZFORMÁCIÓJA 


NÉLKÜL baz (8) 

A VÁLTOZÓK TRANSZFORMÁCIÓ- 

JÁVAL (9) 
KOVARIANCIAMÁTRIX SZÁMÍTÁSA . (A) 
VISSZA A FŐMENÜHÖZ (B) 


Az INTERAKTÍV PROGRAM A MEGFELELŐ ALPROGRAM KIVÁLASZ- 
TÁSÁRA című program itt is kérdések feltevésével segíti a megfelelő program ki- 
választását, majd be is hívja azt. 

Valamennyi egyváltozós regressziós, és a többváltozós lineáris regressziót végző 
program is azonos módon épül fel. Először az ismertetést írathatjuk ki, majd az 
adatokat kell bevinnünk, amit lemezről is, billentyűzetről is megtehetünk. Az adat- 
bevitel után ellenőrzésre kiírathatjuk az adatokat a képernyőre. Ezután a program 
elvégzi a számításokat, majd kiírja a regressziós modell együtthatóit. 

Kívánság szerint a regressziós táblázatot is kiírathatjuk, majd kérhetjük a mérési 
pontok mért és számított értékeinek listáját. (A regressziós táblázat a regresszió- 
számításnál fellépő négyzetösszeg felbontását, az illesztett függvény illeszkedésének 
jellemzésére szolgáló T értéket, a korrelációs koefficiens számított értékét tartalmazza.) 

Ezután az adott intervallumon belül a független változó bármely értékéhez ki- 
számíthatjuk a függő változót az illesztett görbe alapján. Végül újabb számítást 
kérhetünk vagy visszatérhetünk a FŐMENÜ-re. 

Ha a KOVARIANCIAMÁTRIX SZÁMÍTÁSA című programot választottuk, 
először az ismertetés kiírását kérhetjük, majd az adatokat kell bevinnünk, lemezről 
vagy billentyűzetről. Az adatok helyességét ellenőrizhetjük a képernyőre való kiíra- 
tással. Ezután következnek a számítások, majd a program kiírja az eredményeket, 
végül újabb számítást kérhetünk vagy visszatérhetünk a FŐMENÜ-re. Természetesen 
valamennyi programban lehetőség van arra, hogy az eredményeket ne a képernyőre, 
hanem a nyomtatóra írassuk ki. 
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2. VALÓSZÍNŰSÉGSZÁMÍTÁSI 
ALAPFOGALMAK 


2.1. A véletlen fogalma 


Ha azt mondjuk, hogy egy jelenség véletlenszerű, ezen nem azt értjük, hogy annak, 
ami végbemegy, nincs oka. Oka mindennek van, csupán arról lehet szó, hogy ez az 
ok számunkra részben ismeretlen. Minden jelenséget az okok bizonyos rendszere 
hoz létre, s ha ezeknek csak egy részét vesszük tekintetbe, a jelenség véletlenszerű. 
A mezőgazdaságban, a gazdasági elemző munkában, környezetvédelemben stb. 
igen sok véletlenszerű jelenséggel találkozunk. Ez indokolja a fenti tudományág 
alkalmazását mindennapi, gyakorlati munkánk tervezésénél és értékelésénél. 


Véletlen kísérlet, véletlen esemény 


Minden valószínűségi probléma valamilyen véletlen kísérlettel kapcsolatos. Vé- 
letlen kísérleten az olyan kísérletet értjük, amelynek kimenetelét az általunk figye- 
lembe vett kísérleti körülmények nem határozzák meg egyértelműen. Megállapodás 
szerint kísérletnek nem csupán egy jelenség mesterséges előállítását nevezzük, hanem 
általánosságban egy jelenség megfigyelését függetlenül attól, hogy azt mi vagy raj- 
tunk kivülálló okok hozták létre. Véletlen kísérlet pl.: egy folyó vízállásának meg- 
figyelése egy meghatározott helyen és időpontban; az átlagos napi középhőmérséklet 
megfigyelése egy meghatározott napon stb. 

Minden véletlen kísérletnek több, esetleg végtelen sok lehetséges kimenetele van. 
Az összes lehetséges kimenetelt együttesen eseménytérnek nevezzük (22). Dobókoc- 
kával dobva nyilván csak a következő csetek lehetségesek: a dobás eredménye 
vagy 1, vagy 2, vagy 3, vagy 4, vagy 5, vagy 6. Ezek az eredmények azonban cso- 
portosíthatók. Pl. : vannak közöttük páros számok (2, 4, 6), páratlan számok (1, 3, 5), 
vannak 3-nál kisebbek (1, 2) stb. Ezeket a csoportokat az osztályozás alapjául 
választott közös tulajdonságuk definiálja. 

Az eseménytérnek valamilyen közös tulajdonság alapján kiválasztott pontjait 
együttesen eseménynek nevezzük. Esemény például az, hogy a dobás eredménye 
páros, ill. páratlan. Vizsgálhatjuk azt az eseményt, hogy egy folyó vízállása egy 
adott helyen nagyobb-e, mint 600 cm. 


Gyakoriság, relatív gyakoriság, valószínűség 


Ha egy véletlen kísérletet egyszer elvégzünk, akkor lehetséges kimenetelére sem- 
milyen bizonyosságunk nincs, azaz semmilyen alapunk nincs arra, hogy a kísérlet 
egy jövőbeni kimenetelét megjósoljuk. A kísérletet többször megismételve fel lehet 
fedezni a véletlen események bekövetkezésében bizonyos törvényszerűségeket. Ez 
abban áll, hogy ha figyelembe vesszük az egyes események gyakoriságát, azaz azt, 
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hogy az illető esemény a kísérletsorozatban hányszor fordult elő, akkor az egyes 
események gyakoriságainak hányadosa bizonyos stabilitást mutat. Ez a stabilitás a 
következőképpen értendő. 

Jelölje A az egyik eseményt, B a másik eseményt, k4 az A esemény gyakoriságát; 
kg a B esemény gyakoriságát. Ekkor a k4/kg hányados viszonylag kis ingadozást 
mutat. Ez azt a feltételezést sugallja, hogy a k4/kg hányados a kísérletek számának 
minden határon túli növelésekor egy meghatározott számértékhez tart. 

A valóságban természetesen nem lehet minden határon túl növelni a kísérletek 
számát. Ezért megelégszünk azzal, hogy nagy számú kísérlet esetén a k4/kg hánya- 
dos gyakorlatilag állandó. 

Ezen az alapon azt mondhatjuk; hogy a kísérlettel kapcsolatos egyes események 
meghatározott, egymáshoz viszonyított relatív súllyal következnek be, és ha vala- 
melyik eseménnyel kapcsolatban ezt a számot önkényesen rögzítjük, akkor minden 
további eseményhez tartozó számérték egyértelműen meghatározottá válik. Az A 
eseményhez ily módon tartozó számértéket az A esemény valószínűségének nevezzük. 

Megállapodunk abban, hogy a biztos esemény valószínűsége 1. (Azaz annak a 
valószínűsége, hogy a kísérlet eredménye eleme az £2 teljes eseménytérnek, éppen 1.) 
Ha éppen n számú kísérletet végzünk, akkor a biztos esemény gyakorisága kg—n. 
Abból, hogy a k4/kg hányados stabilitást mutat következik, hogy a k4/n hánya- 
dos is stabilitást mutat. 

Egy A eseménnyel kapcsolatban a k4 gyakoriságnak és a kísérletek számának 
(1) hányadosát, a k4/n értéket az A esemény relatív gyakoriságának nevezzük. 
Gondoljuk végig, hogy ezzel a valószínűség skálája rögzített. Ugyanis a megálla- 
podás szerint az £ biztos esemény valószínűsége 1, az A esemény k4/n relatív 
gyakorisága az A esemény valószínűségének közelítő értéke. Ha az A esemény való- 
színűségét P(A)-val jelöljük, az £ eseményét P(2)-val, ami a megállapodás szerint 
P(2)—1, akkor minden esemény valószínűsége 0 és 1 közé esik 


0 — P(A) £ 1. 


2.2. A valószínűség axiómái, valószínűségeloszlás, 
valószínűségi mező 


Legyen A és B két egymást kizáró esemény. (Ez fontos, mert nem minden esemény- 
pár zárja ki egymást. Gondoljunk csak arra, hogy az a két esemény, hogy a kocka- 
dobás eredménye kettőnek hatványa, ill. páros, nem zárják ki egymást.) Ha az 
A és B két egymást kizáró esemény, azt úgy jelöljük, hogy AB-—0O. Ekkor 

ka18 — kat kg: 
Ebből következik, hogy 


KAB - ka ke 
n n n 
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és így 
P(A73-B) — P(A)73-P(B). 


Egymást kizáró események valószínűsége tehát egyenlő az egyes valószínűségek 
összegével. Ha két esemény helyett tetszőlegesen sok, egymást kizáró eseményt tekin- 
tünk, az összegesemény valószínűsége akkor is egyenlő az egyes valószínűségek 
összegével. 

A valószínűségszámítás axiómáit ezek után a következőképpen értelmezhetjük : 
legyen adott az eseménytér, értelmezzük ennek részhalmazain, az .4 balmaz A ese- 
ményein a P(A) függvényt. Ezt valószínűségnek nevezzük, ha erre teljesülnek az 
alábbi axiómák : 


I. 0£ P(A) —1, 
II. P(O) — 1. 
III. Ha A;, Az, 


egymást páronként kizáró eseményekből álló véges vagy végtelen sorozat, vagyis 
ha A;A,—0 ha izk, akkor 


PR A,) — 2 P(Ap. 


P(A;) jelöli tehát az A; esemény valószínűségét. A P(A,), P(A)), ... az Ai, Az; .-. 
eseményrendszer valószínűségeloszlása. 

A P(A) függvényt ekkor az A;, A;, ... eseményrendszer valószínűségeloszlásának 
nevezzük. (Így most a P(A) függvény is, és P(A)-val jelöljük a konkrét számot is, 
ami mint valószínűség az A eseményhez tartozik. Ez nem okoz félreértést, hiszen 
közönséges függvényeknél is y(x)-szel jelöljük a függvényt is, és a konkrét számot 
is, amit a függvény az x független változó értékhez rendel). 


Valószínűségi változó 


Az olyan változót, amelynek aktuális értéke a véletlentől függ, valószínűségi 
változónak nevezzük. Ez így meglehetősen vulgáris, de szemléletes megfogalmazás. 


Valószínűségi változók eloszlásai 


Minden É valószínűségi változó létesít a számegyenesen egy valószínűségeloszlást, 
abban az értelemben, hogy a számegyenes minden részhalmazához hozzá lehet 
rendelni azt a valószínűséget, amellyel a valószínűségi változó számértéke az illető 
részhalmazba esik. Legyen X a számegyenes egy rögzített pontja; és tekintsük az 


F(XX-P(E SX) 


valószínűséget. Ha az X-et — cc-től -t cc-ig futtatjuk, akkor egy x-től függő függ- 
vényt kapunk. Ezt a függvényt a € valószínűségi változó eloszlásfüggvényének ne- 
vezzük. 

Arra a kérdésre tehát, hogy mi a valószínűsége annak, hogy egy valószínűségi 
változó egy adott értéknél kisebb (vagy nagyobb) értéket vesz fel, az eloszlásfüggvény 
ad választ. 
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Az eloszlásfüggvény egyszerű tulajdonságai a következők : 
I) F(CXDEAF(x2) ha xij-—xa azaz az eloszlásfüggvény monoton. 
2] lim F(x) —0 
3) lim F(x)— 1. 
x— too 


A valószínűségek az eloszlásfüggvényekből származtathatók. 
Mivel 
P(É c a34P(rasé€-b) —P(É-cb) ha a-cb, 
ezért 
P(a s € — b) — F(b)—F(a). 


Eloszlások osztályozása, sűrűségfüggvény 


A valószínűségi változóknak és eloszlásaiknak több fajtáját különböztethetjük 
meg. 
a) Diszkrét valószínűségi változó. Diszkrétnek nevezzük a ő valószínűségi változót 
és annak eloszlását, ha lehetséges értékei egy véges vagy végtelen Xj, Xo, ... SOTO- 
zatot alkotnak. Ekkor az F(x) eloszlásfüggvény helyett szívesen dolgozunk a 
—-P(€—x,), n—1, 2, ... valószínűségekkel. Ezek egyértelműen meghatározzák a ő 


eloszlását. 
F(x)— PE cx)— 2 PG — x. 


b) Folytonos eset. Folytonosnak nevezzük a É valószínűségi változót és annak 
eloszlását, ha van olyan f(6)sb függvény, hogy a számegyenesen minden (a, b) 
intervalluma esetén 


F(b)—F(a) — P(a s é — b) — J J(x) dx. 


Az f(x) függvényt a ő valószínűségi változó sűrűségfi üggvényének nevezzük. Az a és 
b határok lehetnek —co-nel és --cs-nel is egyenlők, az a— —co, b—x esetben 
az előző képlet éppen az eloszlásfüggvényt adja 


FG) a f 0 at. 


Az egész számegyenesen integrálva pedig 


oo 
J fG)dx s 1. 


Fel kell hívni a figyelmet itt néhány fontos dologra. Folytonos eloszlás esetén az 
FC) az x változó folytonos függvénye, ő tehát minden értéket 0 valószínűséggel 
vesz fel! Ha F(x) nemcsak folytonos, de differenciálható is, akkor deriváltja éppen a 


sűrűségfüggvény fil sg 
Xx) -— XX). 


Végül hangsúlyozni kívánjuk, hogy sűrűségfüggvénye csak folytonos valószínűségi 
változónak van. 


20 


A szemléletesség kedvéért a következő ábrák a diszkrét és folytonos eset eloszlás- 
függvényeit, ill. a folytonos eloszlású valószínűségi változó sűrűségfüggvényét mu- 
tatják : 


F(x) J 
1 


—] . — 


! 


x x 
1. ábra. Diszkrét valószínűségi változó 2. ábra. Folytonos valószínűségi változó 
eloszlásfüggvénye eloszlásfüggvénye 
0-f 
X 3. abra. Sűrűségfüggvény 


c) Kevert eset. A gyakorlatban előfordul olyan valószínűségi változó is, amelynek 
eloszlása az előbbi két típus keverékének tekinthető. Bizonyos X., Xa, ... értékeket 
pozitív valószínűséggel felvesz, de vannak az eloszlásnak folytonos részei is. Pon- 
tosabban van olyan f(xYds6 függvény, amelynek az egész számegyenesen vett in- 
tegrálja véges és pozitív 


b 
Pr(az€cb— f[ feddxi 3 , P(E — x,). 


azxypa 


2.3. Várható érték, szórás 


A várható érték értelmezése a valószínűség és a valószínűségi változó értelmezésén 
alapul. Célszerű különválasztani a diszkrét, folytonos és kevert valószínűségi vál- 
tozók esetét. Jelöljük M(ő)-vel a É valószínűségi változó várható értékét. Ekkor: 


a) Diszkrét eset 
Ha € lehetséges értékei x1, xa, ... xn és ezeket pi, pa, ..., Dn valószínűségekkel veszi 
fel, akkor 
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M(ő) — 2 X;Di- 


Végtelen sok x; esetén a definíció csak akkor értelmes (azaz a várható érték csak 
akkor létezik), ha az előbbi képlet jobb oldalán álló sor abszolút konvergens, azaz ha 


2 xi] pi: — so. 
Lá 


Ha é—állandó, akkor p(£—c)—1, tehát M(Ó)J—c, azaz konstans várható értéke 
önmaga. 


b) Folytonos eset 
Ha é folytonos eloszlású, akkor van sűrűségfüggvénye f(x). Ekkor 


-koo 


MG - f xf0ddx. 


— 00 


A diszkrét esethez hasonlóan fel kell tételezni, hogy az integrál abszolút konver- 


gens, azaz 
Hoo 


J IxI f(x) dx — -4-os, 


— co 


ellenkező esetben azt mondjuk, hogy nincs várható értéke é-nek. 


c) Kevert eset 
Ha É kevert eloszlású valószínűségi változó és p;— P(É—x;), akkor 


-k- o 
MO — f xfejdx 3 xpi 

feltéve, hogy 

f BI) dxa-Z (x) pi — 4 es, 


— 00 


különben a várható értéket nem értelmezzük. 

Mivel a várható érték nem függ a valószínűségi változó konkrét jelentésétől, 
csupán eloszlásától, ezért a várható értéket a valószínűségi változó által a szám- 
egyenesen létesített eloszlás várható értékének nevezzük. Csupán a várható érték 
még eléggé kevés információt ad egy valószínűségi változó eloszlására. Adott vár- 
ható értékű valószínűségi változó eloszlása még igen sokféle lehet. Pl. minden 8 
pontra szimmetrikus eloszlású valószínűségi változó várható értéke 0. Sőt vannak 
olyan valószínűségi változók, amelyek eloszlása nem is szimmetrikus a 0 pontra 
várható értékük mégis 0. 

A várható érték egy € valószínűségi változó eloszlásának centrumát adja meg. 
A szórás az eloszlás centrum körüli szóródását hivatott mérni. 

A € valószínűségi változó szórása a €— M(£) valószínűségi változó négyzetének 
várható értékéből vont pozitív négyzetgyök, jele c(ó), 


o(£) — VMŰ(É—MODJ) . 


Ahhoz, hogy szórásról beszélhessünk, eleve fel kell tételezni, hogy ő várható értéke 
létezik és 


22 


MI(É— MCD) M?(Ó) Coo. 
A szórás kifejezhető a €? és £ valószínűségi változók várható értékeivel is 


9?(6) — M()—M?(0. 


2.4. Fontosabb eloszlások 


2.4.1. Diszkrét eloszlások 


Binomiális eloszlás 


Tegyük fel; hogy n független kísérletet végzünk, és a kísérletnek két lehetséges 
kimenetele van: a sikeres, amely p valószínűséggel következik be és a sikertelen, 
1—p valószínűséggel. A sikeres kísérletek száma 0 és n közé esik. Belátható, hogy 
annak a valószínűsége, hogy a kísérletből éppen k számú legyen sikeres, 


Pp —k— [Jat 


Ezzel a kifejezéssel tulajdonképpen egy diszkrét eloszlást definiáltunk, ez az ún. 
binomiális eloszlás. 

A binomiális eloszlás két paramétere n és p. 

Várható értéke M(80)—np. 

Szórása 0?(0)—np(1—p). 

Az eloszlás csak akkor szimmetrikus, ha p-—0,5. Egy ilyen esetet szemléltet a 


FŐMENÜf-ből kiválasztott 

ELOSZLÁSOK menü 

ELOSZLÁSFÜGGVÉNYEK KIRAJZOLÁSA almenüjének 
BINOMIÁLIS ELOSZLÁS programja (n—8, p—0,5) 


at 
bíinmnominanlis elosztlasg 
bisz tag ate ae 
nzít, psz.g 


, 
í 
l 
j) 


aj HB 


jö —szezászásséts 


ki 


4. ábra. A binomiális eloszlás hisztogramja 11—8, p—0O,5 esetén 
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(A program behívását, elindítását és a programcsomag használatát részletesen is- 
mertetjük az 1. fejezetben.) 
A binomiális eloszlás használatának mélyebb megértéséhez tekintsük a következő 
példát: 
3 kockával dobunk, vagyis a kísérletek száma 3. Legyen célunk a 6-os dobás, azaz 
nevezzük sikeresnek azt az eseményt, amikor 6-ost dobtunk valamelyik kockával. 
Ennek valószínűsége nyilván bármely kocka esetén 1/6. Lehetséges, hogy egyik 
kockával sem dobunk hatost, ez nem sikeres (X— 9) lehet, hogy egy kockával (k—1), 
lehet, hogy kettővel (X—2) és lehet, hogy mindhárommal hatost dobunk (k—3). 
Számítsuk ki, melyik esemény milyen valószínűséggel következik be a fenti négy 
esemény közül. 

Mivel 3 kockával dobunk, n—3, és az előbbiek szerint p—1/6. Ki kell számíta- 
nunk a valószínűségeket k—0, 1, 2, 3 esetekre. 
Válasszuk ki tehát az ELOSZLÁSOK menüjéből a BINOMIÁLIS ELOSZLÁS-t. 
Erről kérhetünk ismertetést, vagy egyenesen rátérhetünk a számolásra. Adjuk meg 
az eloszlás paramétereit és a figyelembe veendő sikeres események számát. 


Első esetben K — 0, 

N s 3, 

Pp — 0,16666 P(0) — 0,57850,58. 
Második esetben K — 1, 

N - 3, 

P — 0,16666 P(1) — 0,34750,35. 
Harmadik esetben K — 2, 

Ne3 

P — 016666 — P(2) — 0,0694 a 0,07. 
Negyedik esetben K — 3, 

Ns3, 

P — 016666 P(3) — 0,0046 —0,005. 


A negyedik számolás után, ha minden lehetőséget korrektül számba vettünk, az 
eddig kiszámolt valószínűségek összege 1,00... lesz, természetesen a kerekítési hibák- 
tól eltekintve. 

Megjegyzés: a binomiális eloszlás p—0,5 valószínűségű, két lehetséges kimenc- 
telű, egymástól független véletlen eseményekre igen nagy N értékekre (N-1000) 
jól közelíthető a normális eloszlással (I. Folytonos eloszlások). 


BINOMIÁLIS ELOSZLÁS 


A változók listája: 


— kiszámított valószínűség, 

— kiszámított valószínűségek összege, 

A$ — meniünél választás, 

ID, O — kiíratásnál választás (képernyő vagy printer). 


K — a valószínűségi változó aktuális értéke, 
N, P — az eloszlás paraméterei, 

S — részeredmények, 

J 

éb 
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Programmagyarázat: 


100: Programcsomagszervezés. 
110—270: A program neve. 
280—530: A program által nyújtott lehetőségek rövid ismertetése. 
540—800: Adatbevitel, számítások. 
810—1000: Eredmény kiírása választás szerint képernyőre vagy nyomtatóra. 
1010: Visszatérés a FŐMENÜ c. programra. 
1020—1090: Várakozás Igen-Nem válaszra. 


Ü EN ERTE ESTEKET 


RE 
as9 REMK SZAMITASOK 6 
78 REM x 


e LEK EKEEHÁ té d 

TzWg 

FRINT CHRá(C1475 

210 BRT MEG AR VALTOÓZOK ES PAHRHMETEREK ERTEKEIT!" 
INFUTVK z9Gk 

IF K-t THEN PRIRTVK FOZTTIY SZAMI":GOTO 638 

IF KXEZINTEK: THEN FPRIMT"K EGESZ SZAM! ":GOTO 638 
INPUTSM s9;M 


IF HCB THEH FRINT"H PÜZITIY SZAMI":GOTÜ 666 

IF IHTKMHZ THEH PRIHT"H EGESZ SZAM!":GOTO 65sü 

1F 9833 THEM PRIHT"M MAX. ERTEKE 339993! ":GÜTÜ 866 
d ÍNPÜTÖB, et FRIMT"K HEM LEHET NAGYOBB H-NEL!":GOTÜ 630 
59 Hőhjtés ÖR PSz1 THEN FRINT"P ő ES 1 KÖZE ESIK!":GüTÜ F10 


IF (H:8oüREK 
8 FOR I51 TOK 

S-3i4(M-It197I 

MEXT I 

SzLOG(S/ 

30 J-EAFCStKELOGEP9tEH-KOXLOG( 1-P3) 
ab TETtrIJ 


B90RÜKzNz THEH 780 


Poisson eloszlás 


A másik fontos diszkrét eloszlástípus a Poisson eloszlás. A Poisson eloszlású 
valószínűségi változó eloszlásfüggvénye a következő képlettel adható meg: 


—-4 


P(r) - (r—0,1,2, ..., a 50). 


A valószínűségek természetesen pozitív értékűek, és összegük (r—0-tól végtelenig 
értve az összegzést) éppen 1. Egyetlen jellemző paramétere u. Bizonyítható ugyanis, 
hogy a Poisson eloszlás várható értéke M(X)—14, szórásnégyzete c?(X) — 4. Leg- 
egyszerűbben a következő rekurziós formulával lehet kiszámítani: 


P(0) — e7 


2P(r) 
rtl 


P(r3-1) — 
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A Poisson eloszlásnak két fontos alkalmazási területe van: egyrészt használják az 
egy adott időintervallumban véletlenszerűen bekövetkező események (pl. balesetek) 
számának becslésére, másrészt egyszerű eszköz a binomiális eloszlás közelítésére, 
ha a binomiális eloszlás p paramétere (a kedvező kimenetel valószínűsége) kicsi. 

A Poisson eloszlással való ismerkedés érdekében rajzoltassuk fel a képernyőre 
jellegzetes képét! A rajzolást a FŐMENÜ ELOSZLÁSOK. menüjének ELOSZLÁS- 
FÜGGVÉNYEK KIRAJZOLÁSA almenüjének (8) választásával, és otta POISSON 
ELOSZLÁS (2) választásával érhetjük el. A felrajzolt kép az 5 várható értékű Poisson 
eloszlás hisztogramjának jellegzetes képe. 


pojssor eloszi ar 
hisztogrcarm jin 
lamhdaz5 


5. ábra. A Poisson eloszlás hisztogramja 


A. Poisson eloszlás használatának illusztrálására tekintsük a következő példát: 
Tegyük fel, hogy egy adott ásványban a meddő részecskék eloszlása véletlenszerű, 
és a Poisson eloszlást követi, tapasztalatok szerint pedig átlagosan 6 meddő szemcse 
van egységnyi tömegű ásványban. Automatikus mintavevő berendezéssel egységnyi 
tömegű ásványt összegyűjtve, megszámláljuk a meddő szemcséket. Mi a valószínű- 
sége annak, hogy 2-nél kevesebb meddő szemcsét találunk az ásványban? 


P(X - 2) — P(X —0) 4 P(X — 1). 


A számolást természetesen kézzel is elvégezhetjük, de gyakorlásképpen hívjuk meg 
az ELOSZLÁSOK menü POISSON ELOSZLÁS programját (2). 
A képernyőn megjelenik a használandó számítási formula és a következő felirat 


ADJA MEG A VÁLTOZÓK ÉS PARAMÉTEREK ÉRTÉKEIT: 

K — ? 

Le? 

A kiírt képletből egyértelműen látszik, hogy K a vizsgált esetben az egységnyi 
tömegű ásványban feltételezett meddő szemcsék száma, azaz K—0-ra és K—1-re 
kell elvégezni a számítást. K—O és L—6 paraméterezéssel 


P(X — 0) — 247875 . 10-83, 
ill. 
K-1I és L-6 paraméterezéssel 


P(X — 1) — 0,014872. 
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Ezek meghatározása után, az eddig kiszámolt valószínűségek összege: 


P(X — 2) — 001735. 


POISSON ELOSZLÁS 


A változók listája: 

K — a valószínűségi változó aktuális értéke, 
L — az eloszlás paramétere, 

I — segédváltozó, 

J — kiszámított valószínűség, 


T — kiszámított valószínűségek összege, 
A$ — menünél választás, 
ID, O — kiíratásnál választás (képernyő vagy printer). 


Programmagyarázat : 
100: Programcsomag-szervezés. 
110—270: A program neve. 
280—510: A program által nyújtott lehetőségek rövid ismertetése. 
520—740: Adatbevitel, számítások. 
750—940: Eredmény kiírása választás szerint képernyőre vagy nyomtatóra. 
950: Visszatérés a , FŐMENÜ" c. programra. 
960—1030: Várakozás Igen-Nem válaszra. 


398 REM 


tj 
SZAMITASOK xx 
d 


360 REMHERKETON KEK KE EE EE E EE KE 4 Et 
Tz-g 


2388 FRINT CHR$£C147) 
5394 PRIMHT"ARDJR MEG A VÁLTOZÓK ES FARRMETEREK ERTEKEIT!" 


628 PRINT 


E18 IMNPUT"K z"; 


629 IF KkcCB OR 


a 


KCZINT(KZ THEH PRINT"K POZITIV EGESZ SZRM!":BOTD 618 


é30 IF Kk2993 THEM FRIHT"K MAXIMALIS ERTEKE 3395":GÜTO 619 


648 FRINT 
658 INPUT"L 


8 
£60 IF LXB8 THEMNSFRINT"LAMBUH FOZITIY SZAM!":GÜTŰ 656 


Ja 
£8B IF K-B THEN 730 
6398 FOR I51 TOK 


798 JzJ4ALOGKI?) 
719 NEAT I 


798 JzEXPC-LHKKLÜGÉLDeJ 2 


740 TETHJ 
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2.4.2. Folytonos eloszlások 


Normális eloszlás (Gauss eloszlás) 


A valóság véletlen jelenségeinek modellezése során gyakran élünk azzal a feltevéssel, 
hogy a valószínűségi változó normális eloszlású. A feltevés azon a matematikai 
tételen alapszik, miszerint nagyszámú, egymástól független valószínűségi változó 
összege az egyes változók eloszlásától függetlenül mindig normális eloszlású, ha 
az egyes változók véletlen ingadozása az összeg ingadozásához képest kicsi. Tapasz- 
talat szerint az arányos skálán mért mennyiségek véletlen mérési hibái igen gyakran 
a normális eloszlás törvényét követik. 

Folytonos eloszlás, szórása és várható értéke egyértelműen meghatározza. A köny- 
nyebb kezelhetőség kedvéért standardizálják M-—G és a—1 paraméterűvé. Elosz- 
lásfüggvénye (és sűrűségfüggvénye) csak az M-től és c-tól függ. Ezért ha a standar- 
dizált alakot használjuk, ez már csak a valószínűségi változó értékétől (x) függ. 
Ez teszi éppen lehetővé a táblázatos megadást és az egységes átszámolást. 

Jellegzetes képét ki is rajzoltathatjuk a képernyőn, ill. a sornyomtatón. Ehhez 
(feltételezve, hogy a statisztikai programcsomag FŐMENÜ nevű programját már 
betöltöttük és a RUN paranccsal elindítottuk) a következőket kell tennünk : 

— Válasszuk ki a menüből az ELOSZLÁSOK programágat a (3) gomb benyomá- 
sával. Ekkor megjelenik a képernyőn a következő felirat: 


TEGYE BE A LEMEZ "A? OLDALÁT! 


— Ha a lemez a meghajtóban volt, a RETURN gomb megnyomására megjelenik 
az ELOSZLÁSOK program almenüje. Ebből a (8) gomb lenyomásával kiválaszt- 
juk az ELOSZLÁSFÜGGVÉNYEK KIRAJZOLÁSA (8) programágat. 

— A képernyőn megjelenik az ELOSZLÁSFÜGGVÉNYEK KIRAJZOLÁSA al- 
menüje. Ebből a NORMÁLIS ELOSZLÁS kirajzolását a (3) gomb megnyomásá- 
val választhatjuk ki. 

A program először a képernyőre rajzolja fel a standard normális eloszlás eloszlás- 
és sűrűségfüggvényét (6. ábra). Jól megfigyelhetjük a sűrűségfüggvény jellegzetes ha- 
ranggörbe alakját, és az eloszlásfüggvény tipikus S görbéjét. Az előbbi az Y ten- 
gelyre szimmetrikus, az utóbbi a (0;0,5) pontra. A görbék felrajzolása után a 
képernyőn a következő kérdés jelenik meg. 


KIRAJZOLJUK PRINTERRE IS? (I/N) 


Az I betű gombjának lenyomására a sornyomtatóra is kirajzolódik mindkét függ- 
vény. 

A normális eloszlásról többet is megtudhatunk a programcsomag segítségével. 
Ha ugyanis az ELOSZLÁSOK menüjéből nem az eloszlásfüggvények kirajzolása 
ágat választjuk, hanem a 


NORMÁLIS ELOSZLÁS (3) 


menüágat, akkor lehetőség van a függvények jellemző értékeinek kiírására is. Pon- 
tosabban mind standardizált, mind nem standardizált normális eloszláshoz meg- 
adhatjuk a valószínűségi változó értékét, és ehhez a program megadja a sűrűség- és 
eloszlásfüggvény értékeket. Ennek jelentőségét megérthetjük, ha arra gondolunk, 
hogy a valószínűségek az eloszlásfüggvény-értékekből származtathatók. Olyan kér- 
désekre lehet így választ kapni, mint pl. : 
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a-t 
standard tormaiis 


:"Bioszlasf ue 
előoszlas Fú ? ugg ny 


6. ábra. A normális eloszlás sűrűség- és eloszlásfüggvénye 


— mi a valószínűsége annak, hogy egy adott várható értékű és szórású normális 
eloszlású valószínűségi változó értéke kisebb, mint a várható érték és a szórás 
összege, a várható érték és a szórás kétszeresének összege, a várható érték és a 
szórás háromszorosának összege. 

Válaszoljuk meg ezeket a kérdéseket! Legyen a várható érték M(59—10 és a szó- 

rás D(£)—2. Ha nem kértünk a programtól ismertetést, akkor megjelenik a kép- 

ernyőn a következő kérdés: 


STANDARDIZÁLT (S) VAGY NEM STANDARDIZÁLT (N) 
VÁLTOZÓRÓL VAN SZÓ? 


Az (N) billentyű lenyomására a program kéri a változó várható értékét (MC(É)) 
és szórását (D(Ó)), majd a valószínűségi változó értékét (X). Ez utóbbi az első eset- 
ben 10--2-—12. Ezt beütve, és a képernyőt választva megjelenítő perifériaként, 
kiíródik a képernyőre a válasz: 


a sűrűségfüggvény értéke 024197... 
az eloszlásfüggvény értéke 0,84135... 


Ez az eredmény azt jelenti, hogy 84,13X a valószínűsége annak, hogy a valószínűségi 
változó értéke kisebb, mint M(ő)3D(Ó). 
A három feltett kérdésre adott választ összefoglalva : 


p(x z M(O)J4-D(Ó)) — 08413, 
p(x z M(O-e2D(Ó)) — 0,9772, 
p(x z M(O4-3D()) — 0,9986. 


Megjegyzendő, hogy a válasz nem függ M(Ő) és D(Ó) konkrét értékétől, azaz 
ugyanezt a választ kapnánk például a standardizált normális eloszlású valószínűségi 
változó esetére is. Másrészt gondoljuk meg, hogy az eloszlás sűrűségfüggvénye 
szimmetrikus és az eloszlásfüggvény a sűrűségfüggvény integrálja. Ez azt is jelenti, 
hogy normális eloszlású valószínűségi változó esetén a várható érték -EID(É) kör- 
nyezetébe esik a valószínűségi változó (0,84135—0,5)92—68,279-os valószínűség- 
gel, az M(ÖA2D(Ó) környezetbe esik (0,9772—0,592—95,449-os, és M(D- 
t3D(£) környezetébe esik (0,9986—0,512—99,729-os valószínűséggel. 

A normális eloszlásból származtatható eloszlástípusokhoz tartozik a 7? eloszlás, 
a t eloszlás és az F eloszlás is. 


29 


NORMÁLIS ELOSZLÁS 


A változók listája: 


— sűrűségfüggvény értéke, 
— eloszlásfüggvény értéke, 
A$, X$, H$ — menünél választás, 
ID, O — kiíratásnál választás (képernyő vagy nyomtató). 


M — várható érték, 

D — szórás, 

pe — a valószínűségi változó aktuális értéke, 
VA — segédváltozó, 

E 

E 


Programmagyarázat : 


100: Programcsomag-szervezés. 
110—270: A program neve. 
280—510: A program által nyújtott lehetőségek rövid ismertetése. 
520—800: Adatbevitel, számítások. 
810—1020: Eredmény kiírása választás szerint képernyőre vagy nyomtatóra. 
1030: Visszatérés a FŐMENÜ c. programra. 
1040—1110: Várakozás Igen-Nem válaszra. 


: SZEMITAZOK 


a HIZALT 455 VAGY!" 
2. STAMORRIIIZALT £M:" 
IHPLTYVALTOZORÓ IL OYAN SZO"GHE 


e 
ódtt FRINT:PRINT: PRINT 
0jtt PRINT"ANIR HEG H VARHATŰ ERTEKETI"V 
SPA IHFUTVM zo "5M 
$-H FEINT: PRINTSADIA HEG H EZJRAZT!" 
sú IHFRUTT"I sz o"; 
S56 GÜTÚ Titi 
7aa Ti : HEG 
"14 FRIHT:FRINT 
"28 FEIHT:FRINT"AIJR HEG A VALTOZI ERTEKET!" 
a INFUTMA zo Ma 
Azt eldőlt 
E-EPe MTESZ SZ DNBEZSZ 


IF 25-A THEH 8 z 
a 6-1-G 
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Exponenciális eloszlás 


Fontos folytonos eloszlás definíciója: a ő folytonos eloszlású valószínűségi vál- 
tozó exponenciális eloszlású, ha sűrűségfüggvénye a következőképpen írható fel: 


ai ha x50 (415 9) 
foz hg ha x0. 


Az előbbiekből következően eloszlásfüggvénye : 


tándáli ha xz0 
FCJ— ha as zÜ 


Egyetlen paramétere 4. Várható értéke 1/4, szórása ugyancsak 1/2. 

Az exponenciális eloszlást elsősorban bizonyos gépi berendezések várható meg- 
hibásodási idejének becslésére használják. Olyan berendezéseknél, amelyeknél a meg- 
hibásodás valószínűsége nem függ a berendezés addigi , előéletétő!". Másik lényeges 
alkalmazási területe a sorbanállási problémák vizsgálata. — 

Jellegzetes képét az ELOSZLÁSOK menü ELOSZLÁSFÜGGVÉNYEK KI- 
RAJZOLÁSA (8) menüágából az EXPONENCIÁLIS ELOSZLÁS kiválasztásával 
a képernyőre (ill. nyomtatóra 15) kirajzoltathatjuk. A 7. ábrán felrajzolt esetta 4—1 
paraméterű exponenciális eloszlás sürűség- és eloszlásfüggvényét mutatja. 


eloszlasfuggyoeny 


exPpPonencialis eloszlás 
lambdazi 


Vass surusegruggyveny 


Op — jr — 


7. ábra. 4—1 paraméterű exponenciális eloszlás sűrűség- és eloszlásfüggvénye 


Alkalmazására illusztrációképpen oldjuk meg a következő feladatot: 
Egy bizonyos elektronikus alkatrész élettartamáról tudjuk, hogy exponenciális el- 
oszlású, élettartamának várható értéke 100 óra. Az ilyen alkatrészek hány százaléka 
fog meghibásodni az első 10 órában, a második 10 órában, ill. a harmadik 10 órás 
periódusban? 
Mivel az átlagos várható élettartam 100 h, 4—1/100. 
A példa megoldásához az ELOSZLÁSOK menüjéből válasszuk ki az EXPONEN- 
CIÁLIS ELOSZLÁS-t. Kiválasztása után meg kell adni 4 értékét (—0,01), majd az 
X értéket, amelynél az eloszlásfüggvény értékét keressük. Ez az első kérdés meg- 
válaszolásakor 10. A képernyőn megjelenik az eredmény : 
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P(S — 10) — 0,09516, 


azaz az első 10 órában átlagban az alkatrészek 9,5296-a hibásodik meg. Mit várha- 
tunk a következő 10 órában? 

Mivel ismét az exponenciális eloszlást fogjuk használni, arra a kérdésre, hogy 
AKAR ÚJABB SZÁMÍTÁST VÉGEZNI? (I/N) az I billentyű megnyomásával, 
igennel válaszolunk. Ekkor újra meg kell adni 4 és X értékét (0,01 és 20). A kép- 
ernyőn megjelenő eredmény: 


A VALÓSZÍNŰSÉG: 0,1812.... 


Ebből levonva az első 10 órában meghibásodott alkatrészek százalékos értékét, a 
második 10 órában meghibásodó alkatrészek százalékban kifejezett mennyiségét kap- 
juk: 

P(IO — x z 20) — 0,18126—0,09516 — 0,0861. 
Azaz az alkatrészek 8,619-a fog várhatóan meghibásodni a második 10 órában. 
Hasonló módon az x—30-hoz tartozó eloszlásfüggvény értékből (0,25918) a har- 
madik 10 órában meghibásodó alkatrészek aránya 


P(20 — x s 30) — 0,25918—0,18126 — 0,07792, 
azaz 789. 
EXPONENCIÁLIS ELOSZLÁS 


A változók listája: 


i B — lambda paraméter értéke, 
X — a valószínűségi változó értéke, 
P — kiszámított valószínűség, 
A$, X$ — menünél választás, 
ID, O — kiíratásnál választás (képernyő vagy printer). 
Programmagyarázat: 
100: Programcsomag-szervezés. 


110—270: A program neve. 
280—630: A program által nyújtott lehetőségek rövid ismertetése. 
640—760: Adatbevitel, számítások. 
770—980: Eredmény kiírása választás szerint képernyőre vagy nyomtatóra. 
990: Visszatérés a FŐMENÜ c. programra. 

1000—1070: Várakozás Igen-Nem válaszra. 


xX? eloszlás 


Csak pozitív valós számokra van értelmezve. Definíciója: legyenek X1, Xa, ..., Xn 
egymástól független standard (0 várható értékű és 1 szórású) normális eloszlású 
valószínűségi változók. Ekkor a 


X —x14x3t...txA. 


X eloszlású valószínűségi változó, z szabadsági fokkal (szabadságfok: a független 
összeadandók száma). Paramétere n. Várható értéke M(x)-n, szórásnégyzete 
0?—2n. 
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REHHEEEEREREBEEEEREEEEEEEEREEE 


REPE $ 
REHt SZAHITAZÜK hd 
REM bd 

ERREEKEEEE: É 


.14 

FRINT JA MEG AH LAMEDR PARRHETER ERTEKET!" 
IHFUT"LÁLAHENA? — ";L 

IF L-8 THEH FRINT"LAHEDRASzO KELL LEGYEM!E!":GÜTÜ 718 
ül JA MEG H VALTOZO ERTEKET!" 


a IHPUT"A 


3 tINT"AZzz8 KELL LEGYEN! ":GüTÜ 74 
3 Pz1-EXFC-LEK) 


A 2? eloszlás jobb megismeréséhez válasszuk ismét a FŐMENÜ-ből az ELOSZLÁ- 
SOK programágat (3), majd az ELOSZLÁSOK menüjéből az ELOSZLÁSFÜGG- 
VÉNYEK KIRAJZOLÁSA programrészt, végül ennek almenüjéből a 


KHI-NÉGYZET ELOSZLÁS-t (5). 


Az (5) billentyű lenyomására kirajzolódik a képernyőre az n1—4 és n—8 szabad- 


sági fokú x? eloszlás sűrűség- és eloszlásfüggvénye. 


nepet emenaanonyatmubezam szazgam 
. knövtntte tr tett e dul 
Pet deli 
sem 


e . ev 


di 
.-7 eloszlastuggveny 


8. ábra. A x? eloszlás sűrűség- és eloszlásfüggvénye —0, 1, 4, 8 esetre 


Látható, hogy ez az eloszlás csak pozitív x értékekre van értelmezve, és nem 
szimmetrikus, sőt a várható értéknél kisebb értékek valószínűsége sem 0,5 (mint azt 
első pillanatban várnánk). Erről könnyen meg is bizonyosodhatunk. Válasszuk 
ugyanis az ELOSZLÁSOK menüjéből a KHI-NÉGYZET programágat, és az is- 
mertetés kiíratását mellőzve, válasszuk mondjuk az n—5 szabadsági fokú 7? elosz- 
lást, és legyen a khi-négyzet eloszlású valószínűségi változó értéke éppen a várható 
érték, azaz 5. 
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A képernyőre (vagy printerre) kiíratott válasz a következő lesz: 


5 KHI-NÉGYZET — 5 


N 
P — 0,5841 


Ez azt jelenti, hogy a várható értéknél kisebb értékek valószínűsége n—5 szabad- 
sági fokú khi-négyzet eloszlás esetén 58.414. Ez a valószínűség természetesen függ 
az eloszlás szabadsági fokától. A szabadsági fok növekedtével tart a 0,5 érték felé: 


A várható értéknél kisebb értékek 


Szabadsági fok valószínűsége 


5 0,5841 
10 0,5595 
20 0,542 
30 0,5343 
45 0,528 


KHI-NÉGYZET ELOSZLÁS 


A változók listája: 


v — szabadsági fok, 
C — khi-négyzet értéke, 
J, A, B, S, T — részeredmények, 
W, I —  segédváltozók, 
A$, X$ — meniünél választás, 
ID, O — kiíratásnál választás (képernyő vagy nyomtató). 
Programmagyarázat: 
100: Programcsomag-szervezés. 
110—270: A program neve. 
280—540: A program által nyújtott lehetőségek rövid ismertetése. 
550—810: Adatbevitel, számítások. 
810—1020: Eredmény kiírása választás szerint képernyőre vagy nyomtatóra. 
1030: Visszatérés a FŐMENÜ c. programra. 
1040—1110: Várakozás Igen-Nem válaszra. 
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5JEH REM d 


1479 
HEG A SZHEBALZAÁGI FÖKÖTTSY 

-ű THEH FRINT"A SZAEHAIZAGI FÖK POZITCEI":GÜTŰ G1A 

INTÉY? THEN FRIHT"H SZHERADZÁGI FÜK EGESZ SZAHI":GCGÖTN €18 
"RINT: IHFUT"AIIR. MEG KHI-HEGYZET ERTEKET" ;(t 

IF CCA THEH FPRIHT"KHI-HEGYZET HETt HEHATTS1": GOT 64A 


74a 


Tt. 
BOTU t 77ű 


Student eloszlás (t eloszlás) 


A Student eloszlás meghatározása W. Gosset ír kémikustól származik. A követ- 
kezőképpen értelmezzük: legyenek YF, xi, Xa, ..., xa független, standard normális 
eloszlású valószínűségi változók. Képezzük az n szabadsági fokú 


X — xitx3t...hxl. 


xX? eloszlású valószínűségi változót. Osszuk el a szabadsági fokok számával és von- 
junk a hányadosból négyzetgyököt. 
Így 
bég 
Fi -hez jutunk. 
Ha az Y standard normális eloszlású valószínűségi változót osztjuk a fenti [ ea - 


nel, az n szabadsági fokú Student eloszlású valószínűségi változóhoz jutunk 


Vny 
[8 SET: 
Vai x2-...4xf 
Értelmezési tartománya: —co—x- oo. Paramétere: n, ahol n pozitív egész szám. 


Elég jól megközelíti a normális eloszlást, különösen, ha n elég nagy. n—20 esetén 
gyakorlatilag egybeesik a normális eloszlással. 
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AZ ELOSZLÁSOK menü ELOSZLÁSFÜGGVÉNYEK KIRAJZOLÁSA al- 
menüjének STUDENT ELOSZLÁS programjával először az n—4 és az n— os 
szabadsági fokú Student eloszlás sűrűségfüggvényeit rajzoltathatjuk ki. Ezt mutatja 
a 9. ábra is. 

Látható, hogy az n—cs szabadsági fokú Student eloszlás éppen a normális el- 
oszlás. Az eloszlás sűrűségfüggvényének kirajzolása után a megfelelő eloszlásfüggvé- 
nyek jelennek meg a képernyőn. Mindkettő kiíratható nyomtatón is. A legegysze- 


student-eloszlas 


SUrUurESGgT€Uuggyany 
pe n-yegtelen 


stuüudemi-eloszlas 


€eleszi as éaugeaw eme 


n-ueagtelen 


9. ábra. A Student eloszlás sűrűség- és eloszlásfüggvénye n—4 és n— co 
szabadsági fokok esetén 


rűbb kérdés, amit a Student eloszlással megfogalmazhatunk, a következő: mi a 
valószínűsége annak, hogy egy 0 várható értékű a szabadsági fokú Student eloszlású 
valószínűségi változó értéke egy előre megadott értéknél nagyobb? 


Legyen feladatunk például anrak kiszámítása, hogy milyen valószínűséggel lesz 
egy ő 0 várható értékű, 10 szabadsági fokú Student eloszlású valószínűségi változó 
értéke nagyobb mint 1. Ai 

Erre a kérdésre választ kaphatunk az ELOSZLÁSOK menü STUDENT EL- 
OSZLÁS programjának használatával (6-os menüág). 

Az interaktív program először megkérdezi, kérünk-e ismertetést a programról. 
Ha igennel válaszolunk, megjelenik a képernyőn egy egyoldalas ismertetés. Ebből 
(többek között) azt is megtudhatjuk, hogy a program ún. kétoldali eloszlást számol. 
Ez azt jelenti, hogy a 1—1 értékhez azt a valószínűséget számolja ki, amellyel á 
valószínűségi változó értéke a [—1, 1] intervallumon kívül esik. Ezért a feltett kér- 
désre majd úgy kell helyesen válaszolnunk, hogy a kért valószínűséget 2-vel osztjuk. 
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Az ismertető elolvasásának nyugtázása után a program megkérdezi a szabadsági 
fokot. Esetünkben n—10. Utána megjelenik a kérés: ADJA MEG A T ÉRTÉ- 


KET! 


Erre válaszképpen beírjuk az 1-et, majd a megjelenítésre kiválaszthatjuk a kép- 
ernyőt (3) vagy a nyomtatót (4). Az eredmény: 


P — 0, 3427. 


Ez úgy értendő, hogy az 1 értéknél nagyobb értékek valószínűsége 


P(é s 1) — 0,3427/2 — 0,1713; azaz kb. 179. 


STUDENT ELOSZLÁS 


A változók listája: 


1 — t-érték, 
D — szabadsági fok, 
A, B, TI — segédváltozók, 
A1, BI, Z — részeredmények, 
A$, X$  — menünél választás, 
ID, O — kiíratásnál választás (képernyő vagy nyomtató). 
Programmagyarázat : 
100: Programcsomag-szervezés. 
110—270: A program neve. 
280—590: A program által nyújtott lehetőségek rövid ismertetése. 
600—920: Adatbevitel, számítások. 
930—1130: Eredmény kiírása választás szerint képernyőre vagy nyomtatóra. 
1140: Visszatérés a FŐMENÜ c. programra. 
1150—1220: Várakozás Igen-Nem válaszra. 
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Fisher eloszlás ( F eloszlás) 


Legyen két független, x? eloszlású, ni és n. szabadsági fokú valószínűségi válto- 
zónk, X, és X.. A kettő hányadosából képzett 


Ész X4/n) 

X2/n2 

valószínűségi változó eloszlása a Fisher eloszlás. Két paramétere n, és n.. Várható 
értéke: 

nz 


M(P) sz: 


feltéve, hogy n, 2. 
Szórásnégyzete : 

2n3(n,-4-n,—2) 
n1(n—2)?(no— 4)" 


0"(F) — 


Elsősorban szórások összehasonlításánál fogjuk alkalmazni. 


AZ ELOSZLÁSOK menü ELOSZLÁSFÜGGVÉNYEK KIRAJZOLÁSA al- 
menüjének FISHER ELOSZLÁS programjával a Fisher eloszlás sűrűség- és eloszlás- 
függvényének jellegzetes képét rajzoltathatjuk ki a képernyőn, ill. nyomtathatjuk. 
A kirajzolt függvény olyan Fisher eloszlást mutat, amelynél a számláló szabadsági 
foka n,—15, a nevező szabadsági foka n.—16. Ezt az esetet mutatjuk be a 10. ábrán 
is. (Az ábrán jól látható, hogy ez az eloszlás nem szimmetrikus!) 


eloszlasfuggyeny 


fisher-eloszlas 
ni5:15,n27-i6 


7. gurusegfuggueny 


; fs Egéggy Egeeeszsszszzszsmááma 


10. ábra. Fisher eloszlás sűrűség- és eloszlásfüggvénye. m—-—15; 12-16 


AZ ELOSZLÁSOK KIRAJZOLÁSA meniüágból visszatérhetünk a FŐMENÜC-be. 
A legegyszerűbb kérdés a Fisher eloszlás használatával kapcsolatban úgy fogal- 
mazható meg: mi a valószínűsége annak, hogy egy adott szabadsági fokpárhoz tar- 
tozó Fisher eloszlású valószínűségi változó értéke egy adott értéket meghalad. Le- 
gyen például n—10; n1.—8. Ekkor az elméleti bevezetőből tudjuk, hogy a várható 
érték 
8 8 
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Számítsuk ki annak a valószínűségét, hogy a mondott tulajdonságú valószínűségi 
változó értéke nagyobb, mint a várható érték kétszerese, azaz 2,67. 

Az ELOSZLÁSOK menü FISHER ELOSZLÁS programjának kiválasztásakor 
először ismertetést kérhetünk az eloszlásról, majd (akár kértünk ismertetőt, akár 
nem) meg kell adni a képernyőre kiírt kérdésekre adott válaszok formájában a 
kiválasztott F értéket (2,67), a számláló szabadsági fokát (10) és a nevező szabad- 
sági fokát (8). Az eredmény (képernyőn vagy nyomtatón megjelenítve) a követ- 
kező : 

N1—10, N2—8, F —2,67 


P — 0,0888. 
Ezt úgy kell értelmezni, hogy 2,67-nél nagyobb értékek valószínűsége 8,8896. 
FISHER ELOSZLÁS 
A változók listája: 


F — §-érték, 

N — számláló szabadsági foka, 

D — nevező szabadsági foka, 

R, B, FI — segédváltozók, 

R1, BI, Z — részeredmények, 

P — kiszámított valószínűség, 

A$ — választás ismertetés kérésnél, ill. további számolásnál. 


Programmagyarázat: 


100: Programcsomag-szervezés. 

110—281 : A program neve. 

290—510: A program által nyújtott lehetőségek rövid ismertetése. 

520—850: Az adatok bevitele, számítások. 

860—1060: Az eredmények kiírása választás szerint képernyőre vagy nyomta- 

tóra. 

1070: Visszatérés a FŐMENÜ c. programra. 
1080—1150: Várakozás Igen-Nem válaszra. 
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SZAMITAR: 


ük 
hg 
Esrptetkk btk 


Ez ÉRTEK BSE 
a THEN PRINT 
ZHAHLALO 5 
KLÁN SEN FRIHT 

E ; 


:GÜTÜ EH 
IHEL ITepE ME ARHI 
THEN FRINT"A 
IHTÉIO, THEN PRIHT"A 


IF FCi THEN v2kt 


GÜTÜ 
Fz1-F 
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3. MATEMATIKAI STATISZTIKAI 
ALAPFOGALMAK 


3.1. Statisztikai sokaság, minta 


A statisztika tömegesen előforduló jelenségek jellemzése minőségi vagy mennyiségi 
adatokkal. Minőségi jellemzéssel ezen a helyen nem foglalkozunk. Az egyszerűség 
kedvéért tételezzük fel, hogy véletlen kísérletet végzünk, és megfigyelt kimenetelét 
egyetlen számadattal jellemezzük. A kísérletek elvégzésével és kimenetelük meg- 
figyelésével tulajdonképpen mintát veszünk az összes lehetséges kimenetelek hal- 
mazából. Ez utóbbit gyakran statisztikai sokaságnak nevezik. Mintát tulajdonképpen 
azért veszünk, mert igen költséges lenne minden lehetséges kísérletet elvégezni. 
A statisztikakészítés alapgondolata lényegében az, hogy a minta valamiképpen jel- 
lemző a sokaságra, és lehetőséget ad a sokaságra vonatkozó becslések elvégzésére. 
A mintavétel a sokaság n számú elemének véletlenszerű kiválasztásából áll. Jelöl- 
jék Xi, Xg, ..., Xn a kiválasztott elemekhez tartozó számértékeket a kiválasztás sor- 
rendjében. A kiválasztás minden egyes lépésben véletlenszerű, ezért bár mindig n 
konkrét számot kapunk, kaphattunk volna másokat is, ezért az x1, X2, ..., Xxa való- 
színűségi változók. 

Statisztikai vizsgálatot a sokaság eloszlására vonatkozó teljes vagy részleges in- 
formáció szerzése érdekében végzünk. Lehetséges, hogy a sokaság eloszlását, de 
lehetséges, hogy ennek csak egyes paramétereit akarjuk meghatározni. Ha ismer- 
jük a statisztikai sokaság eloszlásának típusát, de nem ismerjük az eloszlás analitikus 
kifejezésében szereplő paraméterek konkrét értékeit, akkor ezeket ún. statisztikai 
becsléssel lehet az n elemű minta alapján közelíteni. 

Ha feltételezzük, hogy csak egy paramétert kell becsülnünk, a sokaság eloszlás- 
függvénye tehát egy F(x, a) függvény, akkor az a valós állandó értékét becsülhet- 
jük az xi, X2, ..., Xa mintaelemek egy 


á — ú(Xx1, Xz; ...5 Xn) függvénye alapján. 


AZ XI, X2, ..., Xa mintabeli változók egy tetszőleges függvényét statisztikai függ- 
vénynek vagy röviden statisztikának nevezzük. Az a paraméter közelítésére alkal- 
mazott statisztikát az a paraméter becslésének nevezzük, és az általa nyert konkrét a 
értéket az a paraméter becsült értékének nevezzük. 
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3.2. A minta feldolgozása: rendezett minta, 
osztályközökbe sorolás, a gyakoriságok 
és relatív gyakoriságok kiszámítása 


Osztályközökbe sorolás alatt a következőket értjük (a statisztikai irodalomban az 
osztálybasorolás kifejezés terjedt el, bár helyesebb lenne osztásközökbe sorolásról 
beszélni). Nagytömegű adat (sokelemű minta) esetén a statisztikai feldolgozás azzal 
kezdődik, hogy adatainkat nagyság szerint sorba rendezzük (rendezett minta). Meg- 
állapítjuk, hogy milyen intervallumba esnek az adatok és a teljes tartományon belül 
résztartományokat veszünk fel, azaz az eredeti intervallumot részekre osztjuk. Ezen 
részek neve osztályköz. Ezután megnézzük, hogy az egyes osztályközökbe hány 
adat került. Például, ha veszünk száz levegőmintát, az SO2 koncentrációt meg- 
határozzuk minden mintában és a legkisebb koncentráció 21 ppm, a legnagyobb 
70, akkor meg lehet vizsgálni, hogy hány minta koncentrációja esett például a 
21—30, 31—40, 41—50, 51—60, 61—70 ppm-es tartományokba. Gyakoriságon az 
egyes osztályközökbe eső elemek számát értjük. Jele 7;, ahol i az osztályköz sor- 
számát jelenti. Ha a gyakoriságot osztjuk a minta teljes elemszámával (esetünkben 
120-szal), akkor a relatív gyakoriságot kapjuk. Jele: g;. 

Az előbbi példánkban legyenek adataink olyanok, hogy f; értékeiként a táblázat- 
ban közölt adatokat kapjuk. Ekkor g;-k (az f; gyakoriságokhoz tartozó relatív 
gyakoriságok) éppen a következő táblázatban megadott értékűek lesznek. 


Osztályköz Ja gi 
118 21—30 12 0,10 
2; 31—40 24 0,20 
B; 41—50 49 0,41 
4. 51—60 23 0,19 
5 61—70 12 0,10 


Tapasztalati eloszlásfüggvény és hisztogram meghatározása 


Az eloszlásfüggvény tapasztalati úton becsülhető, a minta adatainak elemzése 
alapján. Tegyük fel, hogy a kísérletben meghatároztuk az x valószínűségi változó 
értékeit: 

Xs $éssi esszéje 


Ha kiszámítjuk az F(x) értékeket (a t a tapasztalati szó jelölése) a következő kép- 
letből: 


1 
Kj-s Z 1, 


x,zx 


akkor megkapjuk az empirikus eloszlási görbe ordinátaértékeit az adott x értékhez. 
A képlet szerint tehát F.(x) értéke az x-nél kisebb x; értékű eredmények darabszá- 
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mának és a kísérletek számának hányadosa. F.(x) monoton növekvő (nem szigorú 
értelemben) és lépcsős. 

Természetesen minden folytonos elméleti eloszlásfüggvényhez tartozik sűrűség- 
függvény. Tegyük fel, hogy adatok eloszlása jól közelíthető valamilyen folytonos 
eloszlással. Folytonos eloszlás esetén, elég kis x-et választva, azt kapjuk, hogy 


wtáax 


P(x 2 €—(x44x)— f JDdt s f0)4x, 


x 


ahol f(x) a tapasztalati sűrűségfüggvény, azaz a sűrűségfüggvény tapasztalati értéke. 
Ez a formula lehetővé teszi a sűrűségfüggvény empirikus közelítését. Osszuk fel 
azt az intervallumot, amelybe ő lehetséges értékei esnek sok kis, egyenként 4x 
hosszúságú intervallum összegére. A kísérletet (amellyel ő kapcsolatos), végezzük el 
n-szer és jegyezzük fel a €-re kapott értékeket. Végezzük el az osztályközökbe soro- 
lást és számítsuk ki a relatív gyakoriságokat. Az egyes osztályközök relatív gyako- 
riságának megfelelő magasságú téglalapot emelve az osztályköz abszcissza inter- 
valluma fölé, és ezt minden osztályközre elvégezve kapjuk az ún. hisztogramot. 
Ez is lépcsős függvény. A hisztogramok vizsgálata az eloszlás jellegének megállapí- 
tásánál jó szolgálatot tehet. 

A legnagyobb gyakoriságú osztályköznek külön nevet is adtak: ez a modusz. 
Ez a fogalom már átvezet a minta jellemző értékeinek számításához. Előbb azon- 
ban nézzük meg, mit is jelent a minta osztályba sorolása a gyakorlatban. 

Legyen feladatunk egy 50 elemű minta feldolgozása. Az adatok az élet bármely 
területeiről származhatnak: beszélhetnénk 50 tehén napi tejhozamáról, 50 felnőtt 
férfi vérének koleszterinszintjéről, egy nagyváros egy forgalmas pontján 50 egymást 
követő napon a levegő kén-dioxid tartalmának átlagértékéről stb. 

Legyenek adataink a következő számértékekkel jellemezve : 


Sorszám  — Érték 
(2) (x) (a) (x) (a) (x) (1) (x) (7) (x) 
1 10 11 12 21 10 31 6 41 21 
2 12 12 11 22 15 32 16 42 12 
8 11 13 13 23 16 33 3 43 16 
4 18 14 13 24 16 34 16,5 44 15 
5 16 15 14 2 1555 39 15 45 16 
6 Í7 16 15 26 12 36 S 46 17 
7 ÚS ÍZ 11 27 13 37 14 47 16 
8 10 18 16 28 15 38 13 48 ri 
9 ÉJ 19 17 29 10 39 12 49 10 
10 20 20 17 30 8 40 10 50 8 


Adatainkat kényelmesen feldolgozhatjuk az ALAPVETŐ STATISZTIKAI JEL- 
LEMZŐK menü MINTAFELDOLGOZÁS OSZTÁLYBA SOROLÁSSAL prog- 
ramjával (2. menüág). 

A program először megkérdezi, hogy adataink lemezen vannak vagy a billentyű- 
zetről kívánjuk azokat bevinni. Tegyük fel, hogy első alkalommal billentyűzetről 
visszük be adatainkat. Először természetesen az adatok számát (a minta elemeinek 
számát) kéri a program, majd egyenként a minta elemeit. 

A program a feldolgozáskor először átnézi az adatokat. Kiírja a minta legkisebb 
és legnagyobb elemét. Ez tájékoztatás a felhasználónak, segít az osztályhatárok 
kijelölésében. Ezután minden osztályköz felső osztályhatárát kell megadni. Legye- 
nek most az osztályok 3 egységnyi szélességűek, azaz a felső osztályhatárok (mivel 
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a legkisebb elem 6, a legnagyobb 21) rendre 9, 12, 15, 18, 21. Ennek megadása után 
a program kiírja (az adott példa esetén): VAN OLYAN OSZTÁLYKOZ, AMELY- 
BEN 8-NÁL KEVESEBB ADAT VAN. (Ez nem hibajelzés, csak tájékoztatás. 
Ezen a ponton a felhasználó megváltoztathatja az osztályhatárokat, hogy megfele- 
lően nagy számú elem essék minden osztályba.) 

Ha az osztályba sorolást helybenhagytuk, megjelenik a következő almenü a kép- 
ernyőn: 


AZ ALÁBBI LEHETŐSÉGEK KÖZÜL VÁLASZTHAT: 


GYAKORISÁGI TÁBLÁZAT (A) 
MODUSZ KISZÁMÍTÁSA j j (B) 
TAPASZTALATI ELOSZLÁSFÜGGVÉNY KIRAJZOLÁSA . (C) 
HISZTOGRAM RAJZOLÁSA (D) 
VÉGE (E) 


Tegyük fel, hogy minden lehetséges számolást szeretnénk elvégezni mintáinkkal. 
Válasszuk először az (A) lehetőséget. A képernyőre kiíródik a következő táblázat: 


GYAKORISÁGTÁBLÁZAT — j 
OSZTÁLYKÖZ GYAKORISÁG RELATÍV GYAKORISÁG 
(6) 9 4 0,08 
12 15 0,3 
15 14 0,28 
18 15 0,3 
21 2 0,04 


A szóköz billentyű megnyomása után felvehetjük eredményeinket mágneslemezre, 
de enélkül is tovább számolhatunk a bevitt adathalmazzal. Bármely billentyű meg- 
nyomása után tovább számolhatunk a programmal. 

A (B) lehetőséget választva a moduszt írathatjuk ki a képernyőre (vagy nyom- 
tatóra). Esetünkben a kiírt eredmény: 


NINCS EGYÉRTELMŰ MEGOLDÁS, TÖBB AZONOS GYAKORISÁGÚ 
OSZTÁLYKÖZ 


Az eredmény érthető, hiszen az előbb láttuk, hogy minda 9E£x-—12, mind a 15£ 
Sx-a18 osztályközbe 15—15 adat esik. Rajzoljuk ezután ki a képernyőre a tapasz- 
talati eloszlásfüggvényt a mintára (C). A következő kép jelenik meg: 
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[/slie] 


T T T 
0 3 6 9 12 45 18 2 8 


11. ábra. Tapasztalati eloszlásfüggvény 


Az eloszlásfüggvény képét a nyomtatóval is kirajzoltathatjuk. 
Ezután a (D) lehetőséget választva a menüből, a hisztogram jelenik meg a kép- 
ernyőn, és a kapott ábrát igény szerint ismét kinyomtathatjuk. 


p(x) 


0 3 6 9 12 15 18 m ? 


12. ábra. Hisztogram 
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MINTAFELDOLGOZÁS OSZTÁLYBA SOROLÁSSAL 


A változók listája: 


N — a mintacsoport elemszáma, 
X(D — a mintacsoport elemei, 
— segédváltozó, 
D — az osztályközök száma, 
L(1) — az osztályközök felső határai, 
K(J) — a gyakoriságok összege a j-edik osztályközig. 
PI) RO) — a gyakoriságok, 
Ox — adatmátrixból kijelölt oszlop száma, 
A$ — igen-nem választás, 
C$ — menünél választás, 
ID — kiíratásnál választás (képernyő vagy nyomtató), 
N$ — adatfile neve, 


HS, HN$, S, SZ — lemezhiba ellenőrzése, 


Programmagyarázat : 


100: Programcsomag-szervezés. 
110—250: A program neve. 
260—1200:  Adatbevitel, számítások 
1210—1370: Menü kiírása, választás. 
1380—1760: Eredmények kiírása választás szerint képernyőre vagy nyomtatóra. 
1770: Visszatérés a FŐMENÜ c. programra 
1780—1900: A program által nyújtott lehetőségek rövid ismertetése. 
1910—2260:  Adatbeolvasás lemezről. Közben lemezhiba ellenőrzése a 2270-es 
szubrutinnal. 
2270—2380:  Lemezhibát ellenőrző szubrutin. 
2390—2490:  Várakozó szubrutin. 
2500—2570:  Várakozó szubrutin Igen-Nem válaszra. 
2580—2920:  Grafikonok felrajzolása. 


46 


BEEERRAEK 
w 
k 


"FRIHT" sTeteÜeT 
JHEN él 


£I4197-h:C5-1 


EA FRINT:PRIM ÜPÜK B ELEME :":PRINT W€1) 
57 ERINT:PRIMT"A MINTACSUŰFŐRT LEGNAGYOBB ELEME £":FRINT MEN) 

XC12COX(M) THEH 71 

"HINIMUHSHRZIMUM, NINCS ERTELME AZ ÜZETALYBR SÜRÖLASNEK." 
18 ü:BÜTŰ 260 

a PRINT:ERINT"HAHY OSZTALYKÖZBE KÍVBNJH SÖPOLHI AZ ADATOKAT?" 


INFUT 1 
grá KRÉH THEH FRIHTIZ ES 18 KÖZTI EBESZV"!BOTŰ FEE 


He 


ÍF hége ÜR Ig 


2IH Tre, SZTELYKOZ FELZO HATARRBTES:IMPUT LCI3 
Ebt "€zL(1- ci; OR LEIOL-(IJ THEM FRIHTYTEVES AŰRTESZHSSÍTTETEEDTŐ BM 


€1-197-L(CIegsőml9ziE-g THEH BIR 
(ET HIJON MEGY":X(5Mm:HSzi 


tI-154i TÜN 
:1-1:TzM 


£195Kf10-Kél-17:1F P(I"Cc8 THEH Hzi 


eT I 
FOR I5i TÓ m:F 


THEH 910 
PRINT MEIN, ( aa 
TI 


AAL KEYVESEBE ELEM VAM!" 
:IF HEZSI" THEH 718 


TEJIYERCJ419:RÉIH19s1:Hsi 


MEg :T I:GOTO 16LA 


47 


"HIS ELÍH1S e 


3.3. A minta jellemzése (középértékek, 
tapasztalati szórás) 


Kétféle középértéktípust különböztetünk meg. A számított középértékek vagy átla- 
gok számítások (aritmetikai műveletek) eredményei, így a minta elemeivel mate- 
matikai összefüggésben állnak, és értékük az adatok sorrendjétől független. A hely- 
zeti középértékek az értékek nagysága szerint rendezett mintában általában ma- 
tematikai műveletek nélkül kijelölhetők. 


a) Helyzeti középértékek. Ilyen a medián és a modusz. A medián (ME) az a közép- 
érték, amely az x; mennyiségek értékeinek sokaságát 2 egyenlő számú tagból álló 
részre osztja úgy, hogy a sokaság egyik felében az x; értékek a mediánnál kisebbek, 
a másikban nagyobbak. Páratlan elemszámú mintánál a középső érték a medián, 
páros elemszámúnál a két középső összegének fele. Információtartalma az eloszlás 
típusától függ, de torzítatlan. Modusznak nevezzük a véletlen mennyiség legnagyobb 
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gyakoriságú értékét vagy értékeit (osztályba sorolásnál a legnagyobb gyakoriságú 
osztályközt). 


b) Számított középértékek (számtani átlag, négyzetes átlag, harmonikus átlag, loga- 
ritmikus átlag). 

Legfontosabb a számtani átlag. Jele: X. 

Kiszámítása : 


x — 8 


ahol x; az i - mintaelem adott tulajdonságának számértéke; n a minta elemszáma, 
a feldolgozásba bevont mérések száma. 

Statisztikai feldolgozásnál, ha adatainkat már osztályközökbe soroltuk, a szám- 
tani átlagot a gyakoriságokból vagy a relatív gyakoriságokból is kiszámíthatjuk : 


az 
2 fe e 
xXsS sz D ErXk 
r KEI 
2 Jr 
K-I 


ahol r az osztályközök száma; k az illető osztályköz sorszáma; xx, az azonos OSz- 
tályba eső elemek jellemzője, pl. az osztályközép a számtani átlaggal becsülve; /, az 
xx, gyakorisága; gy az xx, relatív gyakorisága. 

A többi középértéktípus számunkra kevésbé fontos, de megemlítjük, hogy négy- 
zetes középértékekkel akkor dolgozunk, ha valamelyik mennyiség egy másik vál- 
tozó négyzetétől függ. Harmonikus átlaggal akkor, ha a reciprokától, logaritmikus 
átlaggal akkor, ha a folyamat logaritmikus összefüggésekkel írható le stb. 


A legfontosabb átlagképzési szabályok a következők. 
Mértani (geometriai) átlag: 


n 
XG Iz ( I xy". 


Megjegyzés : 
n 
Ho Ed És áregékgy 
TES 
Harmonikus átlag: 
- n 
yes 1 
i-1 Ea 
Négyzetes átlag: 
2 Ai 
Xy e 
úi n 
Logaritmikus átlag: 
b3 log (x;) 
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A középértékek semmit sem mondanak az adatok szóródásáról, hiszen ugyanaz a 
középérték csupa azonos értékű mintaelem alapján is, de egészen különbözőekből is 
kijöhet. Ezért szükség van a szóródás jellemzésére is. 

Az adatok szóródását jellemezhetjük a minta terjedelmével. Ez a minta legnagyobb 
és legkisebb elemének különbsége. Hasonlóan a moduszhoz és a mediánhoz, a ren- 
dezett mintában további számítások nélkül, közvetlenül megadható. A minta ele- 
meinek eloszlásáról azonban keveset mond. A minta elemzésénél a minta szóródá- 
sát a korrigált tapasztalati szórásnégyzettel szokás jellemezni : 


Z0a—ny 


00 n-i 7 
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Bizonyítható, hogy a korrigált tapasztalati szórásnégyzet várható értéke a valószí- 
nűségi változó elméleti szórásnégyzete, így az elméleti szórásnégyzet becslésénél a 
korrigált tapasztalati szórásnégyzetet kell használni. 

Megjegyezzük, hogy a régebbi szakirodalomban gyakran a tapasztalati szórás- 
négyzet alatt korrigálatlan értékét értik, azaz az előbbi képlet nevezőjében n—1 
helyett a áll: 


b (4—xy 


n 


sz 


Ha az x,—x értékeket vektor alakba rendezzük, pl. a következő módon: 


xp—X 
X.—X 

szd, 
Xn—X 


Sa , Afd 
n—-1" 7 gt j 
34-i 

ksz1 


ahol dp—xp—x. 

Az utolsó képletben r az osztályközök száma, d, az osztályköz átlag és a teljes 
minta átlagának eltérése. . 

Az ALAPVETŐ STATISZTIKAI JELLEMZŐK menüjéből az ÁTLAG-, ME- 
DIÁN- ÉS SZÓRÁSSZÁMÍTÁS (1) lehetőséget választva lehetőségünk van külön- 
böző átlagolási szabályok szerinti átlagképzési módokat kipróbálni, akár ugyan- 
arra az adatsorra. Gyakorlásképpen tekintsük a következő 10 adatot: 10, 12, 11, 
18, 16, 17, 15, 10, 9, 20. A megfelelő menüág kiválasztása után természetesen ez 
alkalommal is lehetőségünk van rövid ismertetőt kérni a programról, majd dönt- 
hetünk arról, hogy lemezen levő adatokat kívánunk feldolgozni vagy adatainkat 
a billentyűzetről visszük be. Tekintsük az egyszerűség kedvéért az utóbbit. Min- 
tánk 10 elemű, ezért A MINTA ELEMEINEK SZÁMA : 10, a 10-es szám begépe- 
lése után be kell írni a minta elemeit. Ezután megjelennek az összes említett értékek : 
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SZÁMTANI ÁTLAG 138 


GEOMETRIAI ÁTLAG 1331 
HARMONIKUS ÁTLAG 12.84 
NÉGYZETES ÁTLAG 14.28 
LOGARITMIKUS ÁTLAG 13.31 
MEDIÁN — 13,5 

SZÓRÁSNÉGYZET 15,07 
SZÓRÁS 3,88 


Látható a táblázat adataiból, hogy a különféle átlagképzési szabályok eltérő 
átlagértékeket adnak. Az eltérés mértéke az adatok eloszlásától függ. Felhívjuk a 
figyelmet arra, hogy ha a sokaság, amiből a minta származik, normális eloszlású, 
akkor a számtani átlag a várható érték legjobb becslésének tekinthető, és ez esetben 
a korrigált tapasztalati szórás az eloszlás szórását jól becsüli. 


ALAPVETŐ STATISZTIKAI JELLEMZŐK 


A változók listája: 


N — a mintacsoport elemszáma, 
X(D — a mintacsoport elemei, 
M1 — számtani átlag, 
M2 — geometriai átlag, 
M3 — harmonikus átlag, 
M4 — négyzetes átlag, 
M5 — logaritmikus átlag, 
MM — medián, 
e — korrigált tapasztalati szórásnégyzet, 
Zü,J) — lemezről beolvasott adatok, 
— adatmátrixból kijelölt oszlop száma, 
A$ — Igen-Nem választás, 


HS, HNS$, S, SZ — lemezhiba-ellenőrzés. 


Programmagyarázat: 
100: Programcsomag-szervezés. 
110—230: A program neve. 


240—1020: Adatbevitel, számítások. 

1030—1240: Az eredmények kiírása választás szerint képernyőre vagy nyomta- 
tóra. 

1250: Programcsomag-szervezés. 

1260—1620:  Adatbeolvasás lemezről. 

1630—1740:  Lemezhiba-ellenőrzés. 

1750—1870: A program által nyújtott lehetőségek rövid ismertetése. 

1880—2060: Várakozás Igen-Nem válaszra. 
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4. STATISZTIKAI PRÓBÁK 


4.1. A statisztikai próbákról általában 


A statisztikai próbák egy vagy több statisztikai sokaság eloszlásaival kapcsolatos 
hipotézisek ellenőrzésére alkalmasak. A hipotézis vonatkozhat az eloszlás típusára, 
vagy az eloszlás típusának ismerete esetén az eloszlás egyes paramétereire. A hipoté- 
zisvizsgálatok közös vonása az, hogy a nullhipotézist igaznak tételezzük fel, majd 
ezen feltételezés mellett megállapítjuk, hogy a próbastatisztikák mint valószínűségi 
változók, milyen eloszlásúak. A valószínűségi változó szélső értékeit, amelyek be- 
következésének már csekély a valószínűsége, kritikus tartománynak tekintjük. Ha 
egy konkrét próbában a próbastatisztika értéke ebbe az ún. kritikus tartományba 
esik, a nullhipotézist elvetjük a rendelkezésre álló minta alapján. A minta elemzése 
és a statisztikai próba tehát azt a kockázatot foglalja magában, hogy esetleg az 
igaz hipotézist elvetjük, ill. a téveset elfogadjuk. 

A gyakorlatban a kritikus tartomány kijelölése úgy történik, hogy az eloszlás 
egyik vagy mindkét végéből levágunk adott valószínűségi szinthez egy-egy darabot 
(13. ábra) és azt mondjuk, hogy ami oda esik, az már nem tartozik a nullhipotézis- 
ben feltételezett eloszláshoz. 


pit)! 


Elfogadási 
tartomány 


Kritikus 
tartomany 


f 


13. ábra Kritikus tartomány kijelölése 


Mennyit vágjunk le? Mindenesetre annyit, hogy az igaz hipotézis elvetésének 
valószínűsége ne legyen túl nagy. Miért nem vállalunk egészen kicsi kockázatot? 
Az 59-os kockázatvállalás pl. azt jelenti, hogy az esetek 596-ában, tehát nagyjából 
minden huszadik esetben tesszük ki magunkat annak a tévedésnek, hogy az egyéb- 
ként igaz nullhipotézist elvetjük. A valószínűségi szintet csökkentve, az ilyen irányú 
hiba csökken, de fellép egy ellenkező irányú hiba: annak lehetősége, hogy a vizsgált 
paraméter nem a nullhipotézisben feltételezett eloszlásból való, de kiválasztott ér- 
téke , véletlenül" a nullhipotézisben feltételezett eloszlás elfogadási tartományába 
esik. Ezt szemlélteti a 14. ábra. 
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Valódi 
eloszlás 


Feltételezett 
eloszlas 


do — €-004 91 88 


14. ábra. Kritikus tartomány elhelyezkedése két átlapoló 
eloszlás feltételezésével 


Ez ellen a hiba ellen elsősorban úgy védekezhetünk, ha a minta elemszámát 
növeljük. A szórás az elemszám négyzetgyökével fordítva arányos. Nagyobb elem- 


számú minta esetén tehát a szóródás csökken; és a sűrűségfüggvények , karcsúbbak" 
lesznek, így nem nyúlnak annyira egymásba. Ezt szemlélteti a 15. ábra. 


15. ábra. A minta elemszámának hatása a minta eloszlására 


Ezzel kapcsolatban ki kell térnünk a szignifikancia fogalmára. A nullhipotézis 
elvetéséhez általában az kell, hogy a vizsgált statisztikai jellemző nullhipotézisben 
feltételezett és valódi értéke elég messze legyen egymástól. Ilyen esetben (a null- 
hipotézis elvetésekor) azt mondjuk, hogy az eltérés szignifikáns. Ez azt jelenti, hogy 
annak a valószínűsége, hogy az eltérést a véletlen okozza, nagyon kicsi. A szignifi- 
kanciaszint az eloszlás , levágott?" darabja alatti terület mértéke. 596-os szignifikan- 
ciaszint azt jelenti tehát, hogy az esetek legfeljebb 54-ában lehetséges, hogy az 
eltérés a nullhipotézisben feltételezett értéktől csak a véletlen hatások következménye. 
Mivel a 109-os szignifikanciaszint esetén ez a tévedés az esetek 104-ában is meg- 
engedett, a 109-os szignifikanciaszint ebben az értelemben , gyengébb". 

A statisztikai próbákat többféle szempont szerint osztályozhatjuk. Ha azt vizs- 
gáljuk, hogy egy adott minta normális eloszlású sokaságból származik-e, akkor 
ún. normalitásvizsgálatot végzünk. Ha a valószínűségi változónkról tudjuk, hogy 
normális eloszlást követ, akkor a normális eloszlás két paramétere, a várható érték 
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és a szórás feltételezett értékének ellenőrzése lehet a feladat. Ha a sokaság elméleti 
szórásnégyzete ismert, a várható értékre vonatkozó hipotézist egymintás u-próbával, 
ha a szórást is a minta alapján kell becsülnünk, egymintás t1-próbával ellenőrizhet- 
jük, az utóbbi esetben azzal a feltételezéssel, hogy a minta alapján számított tapasz- 
talati szórás várható értékben megegyezik a sokaság szórásával. 

Vizsgálható két paraméter egyezése is statisztikai próbákkal. Normális eloszlású 
valószínűségi változók esetén, ha a várható értékek egyezésére vonatkozó hipo- 
tézist vizsgáljuk, és az elméleti szórások ismertek és azonosak, akkor az ún. 2-mintás 
u-próbát alkalmazhatjuk. Ha az elméleti szórásnégyzeteket a minta tapasztalati szó- 
rásnégyzeteivel becsüljük, akkor az ún. 2-mintás t-próbával dolgozhatunk; azzal a 
feltételezéssel, hogy az ismeretlen elméleti szórások megegyeznek. Két szórás egye- 
zésének vizsgálatára alkalmas az F-próba. Ha az elméleti szórások nem ismertek, 
azaz értéküket a korrigált tapasztalati szórásokkal becsüljük, s az F-próba szerint 
nem egyeznek meg egymással, akkor a várható értékek egyezésének vizsgálatára a 
Welch-próba használható. Több szórás egyezésének egyidejű vizsgálatát a Bartlett- 
próbával végezhetjük. 


4.2. Függetlenségvizsgálat - próbával 


A gyakorlatban gyakran felmerül az a kérdés, hogy egy véletlen esemény kimenetelét 
valamilyen tényező befolyásolja-e vagy sem. Ilyen befolyásoló tényező (faktor) lehet 
pl. a hely, idő, valamilyen mesterséges behatás (kezelés) stb. Tekintsük a következő 
példát: Egy gyár két különböző üzeme gyárt porszívót. Egy-egy szállítmányt ki- 
választva mindkét üzemből, 6 hónapon át figyelemmel kísérik az eladott porszívók 
meghibásodását, azaz azt, hogy az első 6 hónapban hány darabot hoztak vissza 
garanciális javításra. A vizsgálat eredményéből arra szeretnének következtetni, hogy 
vajon az egyik gyár szignifikánsan jobb terméket (kevesebb garanciális javítást 
igénylő terméket) gyárt-e, mint a másik vagy sem. A kérdésfelvetés egyenértékű 
azzal, mintha azt kérdeznénk, hogy a 6 hónapon belüli meghibásodás független-e 
attól, hogy melyik üzemben gyártották a porszívót. 

Az egyes üzemekből kibocsátott porszívók meghibásodási statisztikája esetünk- 
ben legyen a következő: 


Hibátlan működésű Garanciális javításra 


(db) küldött (db) 
A üzem 10 31 
B üzem 23 48 


A táblázatban voltaképpen a porszívókat két jellemzőjük szerint osztályoztuk: a 
gyártás helye szerint és a 6 hónapon belüli meghibásodás bekövetkezése szerint. 
Ennek alapján kétszeres osztályozást végeztünk. Az eredményt ún. kétmezős kon- 
tingenciatáblázatban foglaltuk össze. Általánosan a kontingenciatáblázatnak le- 
gyen r sora és c oszlopa. Végezzünk n véletlen kísérletet, és jelölje n;; azon kísérle- 
tek számát, amelyek az i sor j oszlopába esnek. Így a következő táblázatot kap- 
juk: 
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rxXc méretű kétmezős kontingenciatáblázat 


Mi Mig... Me M. 
Hai Haz ... Hac Ne 


Na Ha -.. Me NM. 


Ha Mass Ni 


ahol n;.— 23 ny azi sorba eső megfigyelések száma, és n; - — 2 niz aj oszlopba 
z 


eső megfigyelések száma. 

Általánosan fogalmazva arra vagyunk kíváncsiak, hogy a kétféle osztályozás egy- 
mástól független-e. Az előző példánál maradva, ha az A üzem nagyobb valószínű- 
séggel bocsát ki 6 hónapon belül hibátlanul működő porszívókat, mint a B üzem, 
akkor a kibocsátás helyétől nem független a meghibásodás valószínűsége. Ezért 
nullhipotézisünket a következőképpen fogalmazhatjuk meg: Legyen p;; annak való- 
színűsége, hogy egy véletlen kísérlet eredménye az i. sor j. oszlopába esik. Legyen 
P:. annak a valószínűsége, hogy a véletlen megfigyelés az i, sorba esik, p.; pedig 
annak a valószínűsége, hogy a j, oszlopba. Nullhipotézisünk az, hogy a sorok és 
oszlopok egymástól függetlenek : 


Ho: pij — Ps. "P.j minden i, j-re. 


A p;. és p;, valószínűségeket az illető esemény relatív gyakoriságával becsülhetjük : 


N;. és n. j 
) ste n D.j n úd 


Ezért, ha H, igaz, az i, sor j, oszlopába esés valószínűségét a következőképpen 
becsülhetjük : 


Nn;. 
NDgj — MP Dag e Me 


Ezt hasonlíthatjuk a megfigyelt n;; gyakorisághoz, és így a következő próbastatisz- 
tikát alakíthatjuk ki: 


[d 
2 el 
ú 2 j-1 n,n./n 
Levezethető, hogy a fenti próbastatisztika szabadsági foka 
(r—1)(c—1). 


Ha a nullhipotézis igaz, a próbastatisztika x? eloszlást követ (r—1)(c—1) sza- 
badsági fokkal. Ha a kiszámított érték nagyobb, mint a X? eloszlás kritikus értéke a 
kiválasztott szignifikanciaszinten, a nullhipotézist, azaz a kétféle osztályozás füg- 
getlenségét el kell vetnünk. A fejezet bevezetőjében feltett kérdés megválaszolására 
hívjuk be a STATISZTIKAI PRÓBÁK menüjéből a FÜGGETLENSÉGVIZSGÁ- 
LAT Xx? PRÓBÁVAL programot. A képernyőn megjelenő kérdésekre értelemsze- 
rűen válaszolva, az ismertetés elolvasása után, vagy anélkül eljutunk az adatok 
megadásának fázisába. Az egyszerűség kedvéért billentyűzetről vigyük be az ada- 
tokat. 
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A. MINTACSOPORTOK. SZÁMA: 
(A TÁBLÁZAT SORAINAK SZÁMA) 


Esetünkben két minta van, az A, ill. B üzemben gyártott porszívóké, a válasz 2. 


A KÜLÖNBÖZŐ ESEMÉNYEK SZÁMA : 
(A TÁBLÁZAT OSZLOPAINAK SZÁMA) 


Mivel az események itt a 6 hónapon belüli javítás bekövetkezése, ill. be nem követ- 
kezése, két (komplementer) ecseményünk van, ezért a válasz 2. 

Ezután meg kell adni a kontingenciatáblázat adatait soronként. A kontingencia- 
táblázat adatainak begépelése után szinte azonnal kiíratható a képernyőre (vagy 
nyomtatóra) az eredmény: 


VALAMENNYI REKESZRE (CELLÁRA) 


ÉSZLELT ÉRTÉK ELVÁRT ÉRTÉK KHI-NÉGYZET 
1. OSZLOP 
10 12,08 0,358 
23 20,92 0,267 
2. OSZLOP 
31 28,91 0,150 
: 48 50,08 0,086 
KHI-NEGYZET 50,8012 


SZABADSÁGI FOK —1 


Hogyan kell értelmezni az előbbi eredményeket? 

Az eredmények első oszlopához nem szükséges magyarázatot fűzni. A második 
oszlopban álló számok azt mutatják, hogy amennyiben az illető csemény mindkét 
üzem termékei között egyforma valószínűséggel fordulna elő, akkor milyen elő- 
fordulási gyakoriságot várhatnánk. Például, ha azt az eseményt nézzük, hogy a 
6 hónapos hibátlan működés az A üzem termékeinél hányszor fordul elő, akkor az 
azonos valószínűséggel való előfordulás azt jelenti, hogy a 41, A üzemből származó 
porszívónál ugyanazt a valószínűséget várjuk, mint az összes (A és B üzemből ki- 
került) porszívónál. Ezért az elvárt érték : 
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A harmadik oszlopban az illető eltérés hozzájárulása áll a kiszámított 4? értékhez 
(tudjuk, hogy a X? érték additív). Az utolsó sszleb összege a keresett 7? érték. 

Hogyan kell értelmezni a 0,8012-es kiírt 42 értéket? Először azt kellene megmon- 
dani, hogy a szóban forgó (1 szabadsági fokú) khi-négyzet eloszlásnál milyen való- 
színűséggel lesz a x? eloszlású valószínűségi változó értéke kisebb, mint 0,812. Ha ez 
a valószínűség kisebb, mint az előre megadott 0,95-ös érték (954-os megbízhatóságú 
döntés), az azt jelenti, hogy még ennél kisebb megbízhatósággal sem tudjuk azt 
mondani, hogy a két valószínűség különbözik, ezért a valószínűségek egyezését el 
kell fogadnunk. 

A 0,812-es értékhez tartozó keresett valószínűséget az ELOSZLÁSOK menü 
KHI-NÉGYZET ELOSZLÁS programjával számíthatjuk ki (használatát lásd ott). 
A 0,8012-höz tartozó valószínűség: 0,6293. A választ úgy kell értelmezni, hogy 
1—0,6293—0,3707 a valószínűsége annak, hogy a két üzem azonos valószínűséggel 
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bocsát ki 6 hónapon keresztül meg nem hibásodó porszívót, és mi mégis külön- 
bözőnek tekintettük ezt a valószínűséget. Mivel azonban mi a kérdésre 1—0,95—0,05 
szignifikanciaszinten kívánunk válaszolni, azt kell mondanunk, hogy ekkora 
(37,079-os) kockázatot az igaz hipotézis elvetésére nem vállalhatunk. Azt kell 
mondanunk tehát; hogy 59-os szignifikanciaszinten a 6 hónapon belüli meghibáso- 
dások valószínűsége a két üzemből kikerülő porszívónál azonosnak mondható. Ezt 
szemlélteti a 16. ábra. 


pls) 


16. ábra. Illusztráció a példa megoldásához 


FÜGGETLENSÉGVIZSGÁLAT KHI-NÉGYZET PRÓBÁVAL 


A változók listája: 


N — a kontingencia táblázat sorainak száma, 

M — a kontingencia táblázat oszlopainak száma, 
XCI, J) — a kontingencia táblázat elemei, 

I, R, KI — segédváltozók, 

G, TD VO — összegzések, részeredmények, 

E — elvárt érték, 

EX —- E kerekítve, 

H — khi-négyzet értéke egy adott értéknél, 

HX — H kerekítve, 

C2 — khi-négyzet értéke összegezve, 

M,N — lemezről beolvasott adatmátrix oszlopainak és sorainak száma, 
R — adatmátrixból kijelölt oszlopok száma, 

O(1) — a vizsgált oszlopok, 

A$ — Igen-Nem választás, 

ID — kiíratásnál választás (képernyő vagy nyomtató), 
N$ — adatfile neve, 


HS, HN$, S, SZ — lemezhiba ellenőrzése, 
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Programmagyarázat : 


100: Programcsomag-szervezés. 
110—240: A program neve. 
250—910: Adatbevitel, számítások. 
920—1250: Eredmények kiírása választás szerint képernyőre vagy nyomtatóra. 
1260: Visszatérés a FÖMENÜ c. programra. 
1270—1500: A program által nyújtott lehetőségek rövid ismertetése. 
1510—1920:  Adatbeolvasás lemezről. Közben lemezhiba ellenőrzése az 1930-as 
szubrutinnal. 
1930—2040:  Lemezhibát ellenőrző szubrutin. 
2050—2150:  Várakozó szubrutin. 
2160—2230:  Várakozó szubrutin Igen-Nem válaszra. 


29: rIMEUT I 


LL.HRH2":FPRIHTRI 
KHI-NERTZET" 


üp: ": RINTI 


ha 
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4.3. Normalitásvizsgálat 


Normalitásvizsgálat grafikus úton 


Elsőként a normalitásvizsgálat egy grafikus módszerét ismertetjük, amely első tájé- 
kozódásra mindenképpen ajánlatos, ha a normális eloszlás egyáltalán szóba kerülhet. 
Végleges döntésre csak abban az esetben alkalmas, ha a múltbeli tapasztalatok 
szerint normális eloszlást követő változó eloszlását csupán ellenőrizni akarjuk, vagy 
ha a grafikus eljárás szemmel láthatóan jó eredményre vezet. A vizsgálathoz ún. 
Gauss-háló (Gauss papír) szükséges. Az ilyen koordináta-rendszernek az a tulaj- 
donsága, hogy a normális (Gauss) eloszlás eloszlásfüggvénye ebben a koordináta- 
rendszerben egyenest ad. A vizsgálat elvégzéséhez az eloszlásfüggvényt az empirikus 
eloszlással közelítjük, azaz mintánkat osztályokba soroljuk és kiszámítjuk az egyes 
osztályokba eső értékekből a kumulált relatív gyakoriságokat az ismertetett módon. 

Az osztályközöket a vízszintes tengelyre (lineáris beosztású tengely) visszük fel, 
a kumulált relatív gyakoriságokat pedig a függőleges (Gauss beosztású) tengelyre. 
Ha a pontok jó közelítéssel egy egyenesre esnek, akkor azt mondjuk, hogy a való- 
színűségi változó eloszlása normális. Azt az abszcissza értéket, amely az 509-os 
kumulált relatív gyakorisághoz tartozik (ahol a közelítő egyenes az 509-os ordináta- 
értéket metszi), a várható érték becslésének tekinthetjük. A szórás becslését is el- 
végezhetjük a Gauss-hálón ábrázolt empirikus eloszlásfüggvényből, hiszen a nor- 
mális eloszlásról tudjuk, hogy a várható érték -- 16 környezetébe esik a valószínű- 
ségi változó értéke 68,39-os valószínűséggel, --2g környezetébe 95,59-os való- 
színűséggel, t3o0 környezetébe, 99,796-os valószínűséggel. Annak a valószínűsége, 
hogy a vizsgált valószínűségi változó értéke a várható értéknél legfeljebb a szórással 
nagyobb, 509645 97-84,1596. Ezt az ordinátaértéket az egyenesre vetítve, a 
kapott abszcissza értékből a várható értéket levonva éppen a szórást kapjuk. 

Megjegyzendő, hogy ha nem a valódi eloszlásfüggvényről, hanem a minta alap- 
ján felvett tapasztalati eloszlásfüggvény ábrájáról olvassuk vissza az 5096-os való- 
színűségnek megfelelő abszcissza értéket, az szigorúan véve a medián értéket adja. 

Nézzünk most egy példát a Gauss-háló használatára. Tegyük fel, hogy van n 
mérési adatunk, és feltevésünk szerint normális eloszlásúak a mérési adatok. Ren- 
dezzük nagyság szerinti sorrendbe mérési adatainkat: 


Minden egyes mérési pontra számítsuk ki a kumulált relatív gyakoriságot (a ta- 
pasztalati eloszlásfüggvény x;-beli értékét) 


2 1 , 
ze AE, sz al 
Pé nti — n-417 


(A nevezőbe azért írtunk n helyett n--1-et, hogy az utolsó mérési pontot is ábrá- 
zolni tudjuk a Gauss-hálón.) Válasszunk megfelelő léptéket x-nek, és ábrázoljuk 
ennek függvényében a kiszámított valószínűségeket. 
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Tegyük fel, hogy B 100-as betonból készült próbatestek nyomószilárdságát N-ban 
mérjük, és 30 véletlenszerűen kiválasztott próbahengerre a következő adatokat 
kapjuk: 


999,1 1003,2 1002,1 9992 989,7 1006, 7 
1012,3 996,4 1000,2 995,3 1008,7 993,4 
998,1 HATA 1003,1 1002,6 1001,8 996,5 
992,8 1006,5 1004,5 1000,3 1014,5 998,6 
9894 1002,9 99958 994,7 1007,6 1000,9 


Az adatokat sorbarendezve és a kumulált relatív gyakoriságokat kiszámítva a 
következő táblázathoz jutunk : 


ű éz F(x. I 3 5. ső) FG) I 7 3; F(x) 
ik 989,4 0,032 11 998,6 0.355 zal 1002,9 0,678 
2 989,7 0,064 12 9991 0,386 VA 1003,1 0,710 
3 992,8 0,097 13 999,2 0,418 23 1003,2 0,742 
4 993,4 0,129 14 999,3 0,450 24 1004,5 0,774 
5 9947 0,161 15 1000,2 0,483 25 1006,5 0,805 
6 995,3 0,193 16 1000,3 0,516 26 1006,7 0,870 
7 996,4 0,225 Í7 1000,9 0,549 27 1007,6 0,902 
8 996,5 0,257 18 1001,8 0,581 28 1008,7 0,908 
9 997,9 0,290 19 1002,1 0,613 29 1012,3 0,934 
10 998,1 0,322 20 1002,6 0,645 30 1014,5 0,977 


A táblázat adatait a 17. ábrán látható Gauss-hálón ábrázoltuk. A pontokra szem- 
mel láthatóan egyenest lehet illeszteni. Ez azt jelzi, hogy mérési adataink normális 
eloszlásúák. Másrészt, az egyenest , szemre? behúzva, az 504-os kumulált relatív 
gyakoriságnál leolvasott x érték 1000,6, ami a mérési adatok várható értékének 
tekinthető, és a 84,154-os és 509-os függvényértékek különbségéből visszaolvasva a 
szórás 6,2-nek adódik. 


Normalitásvizsgálat y? próbával 


Ha a Gauss-hálóval végzett normalitásvizsgálat nem ad egyértelmű eredményt, 
és a minta elég nagy (minden osztályközbe 5-nél több adatunk esett), akkor a nor- 
malitásvizsgálatot x? próbával is el lehet végezni. (A X? próba sok más statisztikai 
vizsgálatra is jó segédeszköz — illeszkedésvizsgálat, homogenitás- és függetlenség- 
vizsgálat végezhető vele, I. az előző pontot.) A 7? próbával végzett normalitásvizs- 
gálat az ún. illeszkedésvizsgálatok közé tartozik. Ilyenkor azt vizsgáljuk, hogy 
valamely valószínűségi változó eloszlása tekinthető-e egy adott konkrét — vagy egy 
adott típusú — eloszlásnak. Ha a nullhipotézis az eloszlásfüggvényt egyértelműen 
meghatározza, akkor ez az ún. tiszta illeszkedésvizsgálat. Amikor a hipotézis az 
eloszlásfüggvényeknek csupán a típusára vonatkozik, és az eloszlás paramétereit 
a mintából kell becsülni, akkor becsléses illeszkedésvizsgálatról beszélünk. 

A x? próbával illeszkedésvizsgálat mind diszkrét, mind folytonos eloszlású való- 
színűségi változó esetén végezhető. Mi itt csak normalitásvizsgálattal, így a foly- 
tonos eloszlású valószínűségi változó esetére vonatkozó illeszkedésvizsgálattal fog- 
lalkozunk. 

Soroljuk adatainkat m osztályba. Tekintsük azokat a diszkrét eseményeket, hogy 
a valószínűségi változó értéke az r-edik osztályközbe esik. 


A sí ző ez rel 2 seg 0). 
Vizsgáljuk meg azt a hipotézist, hogy 
Ho: P(A,) 2 di F(z)—F(z, 
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vi kó 


001 9999 
í ] ; 
TETETEETE TETT ] ETETETT i CEHEKEKKE 
i Li 138 Hi I KE 
005 HEH : d HittE 1 ] EEHHEEE 9995 
rt MERT 
01 t HTTTT] 999 
0.2 TTI 1 TT 998 
(EKHEEENNE LELL] ] öllá IR EHEHAL 
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2 Hi íj ; TT : rH 98 
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TI ih] ij ! :/ [ 4.1 
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20 : - HETE 80 
30 H - 70 
40 1 60 
ps 
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70 . 30 
fű 1 - : 
80 - 20 
90 10 
vs ] j 7 5 
[/ I ! 
TI I TT] TT 
98 2 
99 H 1 
; ] 05 
HAB ak. 4. 
998 ! HEHTEHETETT 02 
999 SE 01 
9995 k itHHHTHIE 005 
9999 001 
9944 do 10068 
1000,6 


17. ábra. Normalitásvizsgálat Gauss-háló segítségével 


azaz azt, hogy az A, esemény valószínűsége az ismertnek feltételezett folytonos 
eloszlás eloszlásfüggvényének z, és z,. 1 argumentumához tartozó értékeinek kü- 
lönbsége. 
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Konstruáljuk meg a következő statisztikát : 


e (NP) 
áj ez 
£ 2 ND. 7 


ahol 7, az egyes osztályközökhöz tartozó gyakoriságok értéke, p, az eloszlásfüggvény 


m 
táblázatából leolvasott két osztályközhatár valószínűségének különbsége N— 5 f, 
r-1 
a minta elemszáma. 

Ha a nullhipotézis teljesül, akkor a számlálóban a zárójeleken belül a gyakori- 
ságok várható értéktől való eltérése áll. Tehát minden zárójelben 0 várható értékű 
valószínűségi változó áll, e körül mutatva véletlen ingadozásokat. Be lehet bizo- 
nyítani, hogy ha N--ce, akkor ez a kifejezés az (m—1) paraméterű x? eloszlás 
felé tart. Ily módon, ha m rögzített és N elég nagy, a kifejezés közel X5, - 1 eloszlású, s 
így a nullhipotézis vizsgálatára adott (1—e) szinthez a következő kritikus tarto- 
mányt adhatjuk : 

XA E Xm-i)- 


A kritikus értékeket az £—0,01, ill. 8—0,05 (1, ill. 596-os) szignifikanciaszinthez a 
Melléklet táblázata tartalmazza különböző paraméterek (m—1) esetén. 

Ha a próbát a normális eloszlás ellenőrzésére használjuk, akkor a p, valószínű- 
ségek kiszámításához a normális eloszlásfüggvényt használjuk (I. a Melléklet 1. táb- 
lázatát). Ha az eloszlás paramétereit (normális eloszlás esetén szórását és várható 
értékét) nem ismerjük, s így a mintából becsüljük, akkor a 2? statisztika eloszlása 
nem (m—1), hanem a mintából becsült paraméterek számával kevesebb (normális 
eloszlás becsléscs illeszkedésvizsgálata esetén (m—3)) paraméterű. 

A módszer illusztrálására tekintsük ismét az előző pontban ismertetett példát. 
A 30 mérési adat , szemre", a Gauss-háló alkalmazásával normális eloszlásúnak 
látszott. Kérdés: igazolható-e ez az állítás y? próbával 15? 

Válasszunk 5 N szélességű osztályokat. A felső osztályhatárok és az egyes osz- 
tályokhoz tartozó gyakoriság értékek így a következők lesznek: 


OSZTÁLYKÖZ GYAKORISÁG 

— 995 5 
995,1—1000 9 
1000,1—1005 10 
1005,1—1010 4 
1010,1—1015 2 
x—1000,6 30 

sz 5976 


Az egyszerűség kedvéért fogadjuk el, hogy az adatok átlaga 1000,6, szórása 6,2 N. 

A példát megoldhatjuk a STATISZTIKAI PRÓBÁK menüjéből a NORMA- 
LITÁSVIZSGÁLAT KHI-NÉGYZET PRÓBÁVAL (5) program kiválasztásával. 
A program lehetőséget ad (az ismertetés felkínálása után) lemezről vagy billentyű- 
zetről történő adatbevitelre. Akár a teljes adatsor (nyers adatok), akár a már osztályba 
sorolt adatok bevitelére. Válasszuk most az utóbbit, és vigyük be az előző táblázat 
szerint osztályba sorolt nyomásszilárdság adatainkat. A minta elemszáma 30, átlag- 
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értéke 1000,6, a korrigált tapasztalati szórást 6,2 értékűnek tekintjük. A kérdésekre 
értelemszerűen válaszolva beütjük az egyes osztályközök felső határait és az illető 
osztály gyakoriságát. A képernyőt kijelölve output periférlának, a következő ered- 
mény jelenik meg: 


KHI-NÉGYZET ÉRTÉKE 0,4015 
SZABADSÁGI FOK 2 
A VALÓSZÍNŰSÉG 0,7819 


Utalva a x? próbával kapcsolatban korábban elmondottakra, az eredményt úgy 
értelmezhetjük, hogy az adatok normális eloszlásúak, hiszen az erre vonatkozó null- 
hipotézisünket csak 2296-os szignifikanciaszint felett tudnánk elvetni. A. szokásos 
1 és 59-os szignifikanciaszinten a minta normális eloszlásúnak mondható. 


NORMALITÁSVIZSGÁLAT KHI-NÉGYZET PRÓBÁVAL 


A változók listája: 


N — a mintacsoport elemszáma, 
X(D — a mintacsoport elemei, 
SI — az elemek összegzése, 
Mil — az elemek átlaga, 
RI — részeredmény, 
01 — korrigált tapasztalati szórás, 
D — az osztályközök száma, 
L(1) — az osztályközök felső határai, 
K(D — a gyakoriságok összege a 3-edik osztályközig, 
PID R(D — a gyakoriságok, 
F(J), G(J) — részeredmények, 
E,Z — normális eloszlás számításánál a változók, 
€() — normális eloszlásnál az eloszlásfüggvény értéke, 
w, www — khi-négyzet eloszlásnál a szabadsági fok, 
J, A, BVS,T — khi-négyzet eloszlás számításánál a változók, 
OXx — adatmátrixból kijelölt oszlopok száma, 
A$ — Igen-Nem választás, 
ID — kiíratásnál választás (képernyő vagy nyomtató), 
N$ — adatfile neve, 
HS, HNS$, S, SZ — lemezhiba ellenőrzése. 
Programmagyarázat: 
100: Programcsomag-szervezés. 


110—250: A program neve. 
260—1780:  Adatbevitel, számítások. 
1790—2020: Eredmények kiírása választás szerint képernyőre vagy nyomtatóra. 
2030: Visszatérés a FŐMENÜ c. programra. 
2040—2240: A program által nyújtott lehetőségek rövid ismertetése. 
2250—2600:  Adatbeolvasás lemezről. Közben lemezhiba ellenőrzése a 2610-es 
szubrutinnal. 
2610—2720:  Lemezhibát ellenőrző szubrutin. 
2730—2830:  Várakozó szubrutin. 
23840—2910:  Várakozó szubrutin Igen-Nem válaszra. 
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560 IF Léz"I" OR 
A FRINT:KzB:FOR 


A IF PS 
389 F(I 
314 IF Fk 
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a REM 
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REM űl 
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6 FRIHT 
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(EH 417418 
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4.4. A várható érték vizsgálata az u és t statisztika 
használatával 


Ebben a fejezetben mindig feltételezzük, hogy normális eloszlású alapsokaságból 
származó véletlen minta (vagy minták) alapján arról kell döntenünk, hogy az is- 
meretlen várható érték milyen feltételezett értékkel egyenlő adott (előre rögzített) 
valószínűséggel. 

A sokaság normális eloszlásának feltételezését az előző fejezetben szereplő nor- 
malitásvizsgálatok egyikével lehet ellenőrizni. A normális eloszlás feltételezése azon- 
ban ne riassza el a felhasználót a fejezetben szereplő próbák alkalmazásától. Van 
egy alapvető statisztikai tétel, az ún. központi határeloszlás tétele. Ez kimondja, 
hogy ha n elemű véletlen mintákat veszünk egy olyan eloszlású sokaságból, amely- 
nek M a várható értéke és ac a szórása (eloszlásáról nem tételezve fel semmit), akkor 
a minták számtani átlagának, X-nak az eloszlása közelítően normális eloszlású lesz, 
ugyanazzal az M várható értékkel és c/Vn szórással. A normális eloszláshoz való 
közelítés a minták elemszámának növelésével javul. 

Ebből a gondolatsorból azt kell kiemelnünk, hogy elegendően nagy elemszámú 
mintánál (pl. n520) a minták számtani átlagának eloszlása közelítően normális 
eloszlású, akármilyen is volt az alapsokaság eredeti eloszlása. 

Mivel a mintaátlagok várható értékc az eredeti sokaság várható értéke, a várható 
értéket a közel normális eloszlású mintaátlagok várható értékének lehet tekinteni. 
Az (xX—M) valószínűségi változó 0 várható értékű, szórása c/Vn. Eloszlása nor- 
mális, ha az eredeti sokaságé normális volt, és közel normális, akármilyen is volt 
az eredeti sokaság eloszlása feltéve, hogy a minta véletlenszerű és elegendően nagy 
elemszámú. Így a most bemutatandó statisztikai próbák egzaktnak mondhatók, ha 
a sokaság eloszlása normális volt, és közelítő jelleggel akkor is alkalmasak sta- 
tisztikai vizsgálatokra, ha a sokaság eloszlásáról semmit sem tudunk. 

Ebben a fejezetben a várható értékek egyezésének vizsgálatára az u-próbát és a 
t-próbát (Student próba) mutatjuk be és szót ejtünk a Student próba egy módosult 
változatának tekinthető Welch próbáról is. 

Mind az u-, mind a t-próba lehet egymintás és kétmintás, azaz alkalmas a vár- 
ható értékre vonatkozó feltételezés ellenőrzésére, ill. két valószínűségi változó vár- 
ható értékei egyezésének elbírálására. A hipotézisvizsgálat elvégzése függ a null- 
hipotézisen kívül az ellenhipotézistől is. Mit is értünk ez alatt? Általánosságban 
a következőket mondhatjuk: A nullhipotézis legtöbbször egy ismeretlen paraméter 
és egy számérték egyenlőségére vonatkozik. PI. : 


Ho: M(o) — a. 
Ha az ellenhipotézis csupán a nullhipotézis tagadása, azaz 

H,: M(0) 7 a 
az azt jelenti, hogy mindegy számunkra, hogy az ismeretlen várható érték nagyobb-e, 
vagy kisebb, mint a. Ezért az előírt p szignifikanciaszintet úgy kell értelmeznünk, 


hogy az illető eloszlás sűrűségfüggvényének mindkét végéből p/2-nek megfelelő 
területet elhagyunk. Az így kapott határokat jelölő kritikus értékkel kell összehason- 
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lítani a számított próbastatisztikát. Ez az ún. kétoldali próba, ill. kétoldali (általában 
szimmetrikus) intervallum kijelölése. 
Ha az ellenhipotézis 
M(2 — a 


alakú, akkor a nullhipotézist csak abban az esetben kell elvetnünk, ha a próba- 
statisztika a kitűzött (kritikus) értéknél nagyobb pozitív szám. Ezért az eloszlás 
sűrűségfüggvényének csak az egyik oldalán kell kritikus tartományt kijelölni, azaz 
a p szignifikanciaszint az egyik oldalon levágott terület mértéke. Ez az ún. egyoldali 
próba. 
Ha az ellenhipotézis 
M(e) — a, 


akkor az előbb elmondottak értelemszerűen megfordítva (előjelcserével) továbbra is 
érvényesek maradnak. A megbízhatósági szint minden esetben (1—p), vagy száza- 
lékban kifejezve 100(1—p)9. 


4.4.1. Egymintás u-próba 


Ezt a próbát akkor alkalmazzuk, ha egy ismert c elméleti szórású normális eloszlású 
alapsokaságból vett A elemű minta átlaga alapján a valószínűségi változó várható 
értékére vonatkozó nullhipotézisünket akarjuk ellenőrizni. Tudjuk, hogy a normális 
eloszlás két paramétere az M várható értéke és a c szórása. Mivel c-t ismertnek 
tételezzük fel, az M várható értékről feltételezzük, hogy egyenlő ag-lal, azaz azt 
akarjuk megtudni, helyes-e az a nullhipotézis, hogy a várható érték ay. 


Ho: M — ag 
vagy másképpen felírva : 
Ho: a —M — 0. 
Ha H, igaz, akkor az 


5-Üj 
u -— 


c 
Vn 
statisztika, mint a statisztikai mintából képzett valószínűségi változó normális el- 
oszlású. 0 várható értékkel és 1 szórással. A nullhipotézis ellenőrzésére a standard 
normális eloszlás táblázatából választunk egy w, számot, amely egy adott p meg- 
bízhatósági szinthez (szignifikanciaszinthez) tartozik. Ha a szignifikanciaszintet a 
szokásos 0,05 (54)-ban rögzítjük, az azt jelenti, hogy ennyi kockázatot vállalunk 
arra, hogy egy jó hipotézist elvetünk. 
Ha az ellenhipotézis a 
BH: M 5 ús 


akkor kétoldali próbáról van szó, ezért a 0,05-ös szignifikanciaszintet is ennek meg- 
felelően kell értelmezni, azaz képzeletben az eloszlás sűrűségfüggvényéből mindkét 
oldalon 2,5—2,54-ot kell levágni. Így a kritikus értéket a 0,025-ös szignifikancia- 
szinthez kell a Melléklet 1. táblázatából kikeresni. D—0,025-höz 1,96-os kritikus 
érték tartozik. 
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Ha a számított u érték ennél nagyobb pozitív vagy az ellentettjénél kisebb negatív 
érték, a hipotézist elvetjük. Azaz, ha 


lul — trrivs 


akkor a hipotézist (H,) hamisnak tekintjük. 

Például egy folyóvízben a higanykoncentrációt sokszor megmérve 2,0 ug/l-nek 
találták és sok (elvileg végtelen sok) mérés alapján tudjuk, hogy c—0,04 g/l. 
Adott időben 64 mintát véve, azokat elemezve, a higanykoncentrációt 1,985 Hg/l- 
nek találjuk. Ellenőrizzük azt a hipotézist, hogy a folyóvíz higanytartalmának vár- 
ható értéke 2,0 ug/l. Oldjuk meg a feladatot az EGYMINTÁS U-PRÓBA program 
használatával! 

A főmenüből a STATISZTIKAI PRÓBÁK. ágat kell választani, a STATISZTI- 
KAI PRÓBÁK menüjéből az U- STATISZTIKA HASZNÁLATÁ-t. 


Ennek hatására megjelenik az U-STATISZTIKA menüje: 


EGYMINTÁS U-PRÓBA (E) 
KÉTMINTÁS U-PRÓBA (K) 
ISMERTETÉST KÉREK (DD 
VÉGE (V) 


Ebből természetesen az egymintás u-próbát választjuk. Az adatokat billentyűzet- 
ről is bevihetjük vagy adatfile-ból olvashatjuk be. Mivel nem a primer adatokkal 
dolgozunk, hanem ismerjük az átlagot és a szórást, egyszerűbb billentyűzetről be- 
vinni az adatokat. Ezt választva interaktív üzemmódban megkérdezi a program a 
minta elemszámát (64), az átlagot (1,985) és a szórást (0,04). Ezek megadása után 
megjelenik a következő menü a képernyőn. 


AZ ALÁBBI LEHETŐSÉGEK KÖZÜL VÁ LASZTHAT: 


U-STATISZTIKA ÉRTÉKEINEK SZÁMÍTÁSA —— (U) 
MEGBÍZHATÓSÁGI INTERVALLUM KISZÁMÍTÁSA (M) 
A MÉRÉSEK SZÁMÁNAK MEGHATÁROZÁSA (N) 
VISSZATÉRÉS A FŐMENÜHÖZ (F) 
VÉGE (V) 


Először válasszuk az u-érték kiszámítása programágat. Ekkor a program megkér- 
dezi a várható értéket (2,0), és azt, hogy egyoldali vagy kétoldali próbáról van-e szó. 
Mivel most ellenhipotézisünk 

ÉV: M(X) A dos 


a kétoldali próbát kell választanunk. 

Ezt követően megkérdezi a program a megbízhatósági szintet. Legyen a szignifi- 
kanciaszint a szokásos 54, azaz a megbízhatósági szint 954. A kritikus érték 54-os 
szignifikanciaszinten a Melléklet 1. táblázata szerint 1,96. Ennek megadása után az 
eredményt képernyőre kiíratva a következő jelenik meg 


U-ÉRTÉK — —2.999. 


9596-os megbízhatósági szinten a hipotézist el kell vetnünk, hiszen a statisztika szá- 
mított értéke nagyobb, mint a kritikus érték. 

Tetszőleges billentyű megnyomásával újra visszatérhetünk az egymintás u-próba 
menüjéhez. Előbb azonban vizsgáljuk meg, mi történne : 
a) Ha a szórás az alapsokaságban nem 0,04, hanem 0,08 lett volna? 
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b) Ha a kétoldali próba helyett egyoldali próbát alkalmaznánk, azaz a nullhipo- 
tézist a 
H : M(xX) — ag 


ellenhipotézissel szemben vizsgálnánk? 
c) Ha a szignifikanciaszintet (a kétoldali próbánál) 0,02-re, azaz 299-ra csökkente- 
nénk? 

A válaszok megkeresését a programmal az Olvasóra bízzuk. Iámpontul a helyes 
válaszok. 
a) Ha a szórás az alapsokaságban nem 0,04, hanem 0,08 lett volna, a nullhipotézist 
el kellene fogadnunk. 
b) A nullhipotézist egyoldali próbánál is el kellene vetnünk. 
c) Ha a szignifikanciaszintet csökkentjük, azaz kisebb kockázatot vállalunk az igaz 
hipotézis elvetésére, akkor a hipotézist esetleg elfogadhatjuk. Ez esetünkben 0,002-es, 
azaz 0,29-os szignifikanciaszintnél teljesül. 29-os szignifikanciaszinten azonban még 
el kell utasítanunk a nullhipotézist. 


4.4.2. Kétmintás u-próba 


Ha két normális eloszlású, ismert szórású sokaságokból vett minták alapján a két 
sokaság várható értékének egyezésére vonatkozó hipotézisünket akarjuk ellenőrizni, 
kétmintás u-próbát alkalmazunk. 

Legyen É és H a két valószínűségi változónk, Xx és $ a ő-re és n-ra vett minták 
aritmetikai közepe, c1—c3—o? a valódi (ismert) szórásnégyzet. A 

Ho: M(Ő) — Mm) 
nullhipotézist a ő-re vett a elemű és az n-ra vett m elemű minták alapján kívánjuk 
ellenőrizni. A próbastatisztika : 
x-Y 


u - EST 
—— - — 
n m 
Ha H; igaz, akkor w eloszlása N(0,1) és adott £-hoz a 
H.: M(Ő) 7 Mm) 
ellenhipotézis mellett a kritikus tartomány: 
X.-(uS5—u, vagy us ul 


e szignifikanciaszinten (kétoldali próba). A HI: M(Ó—M(m) ellenhipotézis esetén 
pedig az 
Xi: (us u) 


a kritikus tartomány. 


A kétmintás u-próba alkalmazásaként tekintsük a következő egyszerű példát: 
Legyen A és B két abszorpciós torony, amelyeket azonos nitrózusgáz elnyeletésére 


mentesítésére. Az A oszlop kimenő gáza 9 független mérés szerint átlagosan 
0,1672 g/m3, a B oszlopé 16 független mérés szerint 0,1683 g/m? nitrogén(ID-oxidot 
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tartalmaz. A kimenő gázok koncentrációja stacionárius üzemmenet esetén állandó, 
a nitrogén-oxid-mérés szórása c —0,00129 g/m?. Kérdés, hogy 1—£—9595-os meg- 
bízhatósági szinten azonosnak fogadható-e el a két elnyelető torony kilépő gázának 
nitrózusgáz-tartalma? A feladat az M(9—M(m) nullhipotézis vizsgálata a 


H.: M(Ó) 7 M(n) ellenhipotézissel szemben. 


Mivel az u-próbához szükséges feltételek fennállnak, a kétmintás u-próbát alkal- 
mazzuk. 

Hívjuk be a STATISZTIKAI PRÓBÁK menüjéből az U- STATISZTIKA AL- 
KALMAZÁSA programot, annak menüjéből kiválasztjuk a KÉTMINTÁS U- 
PRÓBÁc-t, és a képernyőt input perifériának kijelölve a képernyőn megjelenő kér- 
désekre válaszolva rendre megadjuk a két minta elemszámát, átlagértékét és szó- 
rását, és megadjuk, hogy kétoldali próbáról van szó, 959-os megbízhatósági szinten. 
A képernyőn megjelenő eredmény a következő lesz: 


. . U-ÉRTÉK — —2,046. . 
KÉTOLDALI PRÓBA ESETÉN 9594-os MEGBÍZHATÓSÁGI SZINTEN A HI- 
POTÉZIST EL KELL VETNI. 


Valóban, az u aktuális értéke a (—1,96; 1,96) tartományon kívül, tehát a kritikus 
tartományba esik, ezért logikus, hogy a nullhipotézist, vagyis a két elnyeletés haté- 
konyságának azonosságát elvetjük. Kérdés azonban, hogy milyen szignifikancia- 
szinten kellene a nullhipotézist elvetnünk? Ennek vizsgálatára hívjuk be az 
ELOSZLÁSOK menüjéből a NORMÁLIS ELOSZLÁS programágat. (Tudjuk, 
hogy az u-statisztika standard normális eloszlású, ha Hg nullhipotézis igaz.) 

A változó értékéül adjuk meg az imént kiszámított —2,046 értéket. A képernyőn 
megjeleníthetjük az eredményt: 


A SŰRŰSÉGFÜGGVÉNY ÉRTÉKE 0,04914, 
AZ ELOSZLÁSFÜGGVÉNY ÉRTÉKE 0,02036. 


A 0,02036 eloszlásfüggvény-érték úgy értendő, hogy ennyi a valószínűsége a 
—2,0465-nél kisebb értékeknek standard normális eloszlású valószínűségi változó 
esetén. "Természetesen ugyanennyi a valószínűsége a 2,0465-nél nagyobb érté- 
keknek is, összesen 0,04072 a valószínűsége annak, hogy valószínűségi változó a 
(—2,0465, 1-2,0465) tartományon kívül esik. 

Következésképpen 100 (1—0,04072) —95,9284-os, azaz durván 9694-os megbíz- 
hatósági szinten már különbséget lehetne tenni a két elnyelető torony hatékonysága 
között! Győződjünk meg állításunk helyességéről! Végezzünk most ismét kétmintás 
u-próbát, de ez alkalommal 96 4-os megbízhatósági szinten! A próba elvégzését az 
Olvasóra bízzuk. 


U-PRÓBA 
A változók listája: 
NM —  mintacsoportok elemszáma, 
X(D, Y0D —  mintacsoportok elemei, 
SL. 52 — elemek összegzése, 
M1, M2 — elemek átlaga, 
01, 02 — szórások, 
P — várható érték, 
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U — u-érték, 
F — konfidencia intervallum (számított), 
R — konfidencia intervallum (megadott), 
G — mérések száma, 
D — megbízhatósági szint, 
j 85 — segédváltozó, 
K(L) — u kritikus értékei, 
— egy- vagy kétoldali hipotézisnél választás, 
OX, OY — adatmátrixból kijelölt oszlopok száma, 
D$ —  menünél választás, 
H$ — Igen-Nem választás, 
B$ — egymintás u-Próba menüjénél választás, 
ID — kiíratásnál választás (képernyő vagy nyomtató), 
N$ — adatfile neve, 
HS, HNS, S, SZ — lemezhiba ellenőrzése. 
Programmagyarázat: 
100: Programcsomag-szervezés. 
110—240: A program neve. 
250—270: DATA: u kritikus értékei. 
280: U kritikus értékeinek beolvasása. 
290—420: Meni kiírása, választás, elágazások. 
430—1290:  Adatbevitel. 
1300—1530: — Egymintás u-próba menüjének kiírása, választás, elágazások. 
1540—1560:  U-érték kiszámítása. 
1570—1590:  Megbízhatósági intervallum kiszámítása. 
1600—1650:  Mérések számának meghatározása. 
1660: Kétmintás u-próba számítása. 
1670—1720: Egyoldali vagy kétoldali hipotézisre választás, elágazás. 
1730—1790:  Szubrutin megbízhatósági szint választására, egyoldali hipotézis ese- 
tén. 
1800—1850: — Szubrutin megbízhatósági szint választására kétoldali hipotézis ese- 
tén. 
1860—2330: Eredmények kiírása választás szerint képernyőre vagy nyomtatóra. 
2340—2580: A program által nyújtott lehetőségek rövid ismertetése. 
2590: Visszatérés a FŐMENÜ c. programra. 
2600—3050:  Adatbeolvasás lemezről és a vizsgálandó mintacsoportok kijelölése. 
Közben lemezhiba ellenőrzése a 3060-as szubrutinnal. 
3060—3170:  Lemezhibát ellenőrző szubrutin. 
3180—3280:  Várakozó szubrutin. 
3290—3360:  Várakozó szubrutin Igen-Nem válaszra. 
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1546 IHFUT"ADJA MEG A VARHATÓ ERTEKET! ";P 

1555 237850HC(M1-FPő:IF NL-A THEM U-(M1-Pő/7 (B1/ZERÉMI5 
js6A GÜTM 16878 
1974A G0ZUB 15886 

1588 F-K(LIEG1-/S0RÉHI 

1590 GOTO 1888 

1698 FRIHT:PRIHT 

1E€18 PRINT"ADJA MEG A HEGBIZHATOZAGI IHTERYALLUM — FEL: 
18626 IMHPUT R:IF RCsü THEM FRIHT"FOZITIY SZAM!I":GOTÓ 18728 
1638 GOSUE 1864 

i646 65-(KéLYERÍVRITZ 

165 GOTŰ 1868 
16E0 Uz(M1-M25/£ 
1672 PRINT:FRIHT 
1597 IHFUT W 
1699 IF HWA2Z1 HHI z THEM 167ü 

1708 IF Lz1 THEM B 17 

1718 IF WZ THEH GÜZSUE 1894 

1729 GÜTD 18E£0 

1730 PRINT:PRIHT"HRHY SZAZALE : MEGBIZHHT: 
1746 PRINT"(B8.5-ES FOHTOSSAGGAL ADJR MEG!" 

1758 IMPUT D . 

í768 IF DCsA OR D535.5 THEM FRIHT"HEM JÚ ADRAT!":GÖTŰ 1730 

1770 IF DEIHTÉD2 AH NXZIHTCD24.5 THEN FRINT"A4.3-EZ FOMTOSSZÁGGHBL !":GÜTÜ 1758 
1788 L-I$2-179 

1798 RETURN 

1899 PRIMHT:FRINT"HAHrY SZAZALEKOS MEGEIZHATÓSAGI SZIMTET VALASZT? (86-gap" 
1819 INFUT [I 

1828 IF D(C39 ÖR 05-33 THEM PRIHT"HEM JO ADRT!":GOTO 18868 

1838 IF DEZINTED2 THEM PRIHT"EGESZ SZAMOT HRILION MEG!!":GÜTŰ 13AA 

1846 L-II-73 

1858 RETURH 


EGET" 


RCD1tz7H4OZ 
EGYOLDHLI 


fd ubi 
VAGY KETÜLDHBLI €25 HIFOTEZISRÜL VAM Szü7" 


( SZINTET VÁLASZT? (9ú-ssásn 


4.4.3. Egymintás t-próba 


Az előző pontban ismertetett u-próba abban az esetben alkalmazható, amikor a 
normális eloszlású valószínűségi változó szórása ismert és a várható értékre vonat- 
kotó hipotézist szeretnénk ellenőrizni. Ha az elméleti szórás nem ismert, akkor a 
következő módon járunk el: Legyen a É valószínűségi változó eloszlása normális, 
vegyünk n elemű mintát és becsüljük az eloszlás elméleti szórását a korrigált ta- 
pasztalati szórással (s). Legyen az eloszlás ismeretlen várható értéke M. A 


Ho: M(Ő) — ay 


nullhipotézis vizsgálatára konstruáljuk a 


statisztikát. Ha a nullhipotézis igaz, akkor a /, , statisztika eloszlása n—1 sza- 
badsági fokú Student eloszlást követ. 
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Ha az ellenhipotézis az 
MCÓ) 7 ay 


azaz mindegy számunkra, hogy kisebb-e a várható érték, mint az , előírt" ag vagy 
nagyobb, akkor ún. kétoldali próbát végzünk. A kétoldali, szimmetrikus kritikus 
tartomány : 

XX ai ked Z-t, vagy t,. 1E tj. 


Adott e szignifikanciaszinthez és n—1 szabadsági fokhoz tartozó t, kritikus érté- 
ket kiválasztva, ha a t, , statisztika értéke a (—t., 1.) tartományon kívül csik (ab- 
szolút értéke nagyobb £.,-nál), akkor a nullhipotézist elvetjük. 

Ha az ellenhipotézis az 

M(Ő) — ag 
vagy az 
M(ó) S do ; 


akkor csak az az eset jelenti a nullhipotézis elvetését, ha zt a kritikus értéknél is 
nagyobb pozitív, vagy az ellentettjénél kisebb negatív érték (egyoldali próbák). 

Kétoldali próbánál a megadott p szignifikanciaszintet úgy kell értelmezni, hogy 
a Student eloszlás mindkét végéből a p/2-nek megfelelő területet levágjuk, és az 
így kapott kritikus értékekkel hasonlítjuk össze a kiszámított t értéket. 

Egyoldali próbánál a p szignifikanciaszint a Student eloszlás sűrűségfüggvényéből 
az egyik oldalon levágott terület mértéke. 

Egymintás £ próbára példaképpen válaszoljunk a következő kérdésekre: Egy 
cellulózüzemben a szulfitlúgból 9 mintát vettek, és mérték a szulfitlúg lúgosságát. 
A lúgossági számok a 9 mintára a következők voltak: 11,7 ; 12,2; 10,9; 11,4; 11,3 ; 
12,0; 11,1; 10,7; 11,6. 

A technológiai előírás 12,1-es lúgossági számot ír elő. Mondhatjuk-e, hogy a 
lúgossági szám megfelel-e a technológiai előírásoknak? Kijelentésünket 9596-os meg- 
bízható szinten kell megtennünk. A kérdés tulajdonképpen az, hogy a 9 elemű 
minta alapján mondhatjuk-e, hogy a lúgossági szám várható értéke 12,1? Mivel 
a szórás ismeretlen, azt is a mintából kell becsülnünk, így Student-próbát alkal- 
mazunk. 

Kiválasztjuk a STATISZTIKAI PRÓBÁK menüjéből az EGY- ÉS KÉTMIN- 
TÁS T-PRÓBA ÉS WELCH-PRÓBA menüjét, és azon belül az EGYMINTÁS 
1-PRÓBÁ-t. Adatainkat akár lemezről is bevihetjük, akár közvetlenül a billentyű- 
zetről interaktív módon. 


A MINTA ELEMEINEK SZÁMA: 9 


Ezután rendre megadjuk a 9 lúgossági szám értéket, majd kiválasztjuk a T-ÉRTÉK 
KISZÁMÍTÁSÁ-t a képernyőn megjelenő menüből. Ez a program először a vár- 
ható értéket kéri: a várható érték a technológiai előírásban szereplő 12.1. Miután 
mindkét irányú eltérés egyaránt káros, kétoldali próbát kell végezni. 954-os meg- 
bízhatósági szintet választva a képernyőn a következő eredmény jeleníthető meg: 


T-ÉRTÉK j ERR — —4 0406 
954-OS MEGBÍZHATÓSÁGI SZINTEN A HIPOTÉZIST EL KELL VETNI. 
SZABADSÁGI FOK —8 


KORR. TAPASZTALATI SZÓRÁSNÉGYZET —0,245 
Valóban, erről úgy is meggyőződhetünk, ha kikeressük a Melléklet 2. táblázatá- 
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ból a 8 szabadsági fokú Student eloszlás értékét 0,05/2—0,025 szignifikancia- 
szinten : 
to,023,8 — 2.306. 


Mivel a kiszámított t érték, —4,0406 kívül esik a (—2,306 ; 2,306) elfogadási tar- 
tományon, a nullhipotézist, azaz a lúgossági szám várható értékének a technoló- 
giai előírásban szereplő 12,1-del való egyezését el kell vetnünk. 


4.4.4. Kétmintás t-próba és Welch-próba 


Kétmintás t-próba 


Ha két normális eloszlású valószínűségi változó várható értékeinek összehason- 
lítása a feladat és a szórásokat nem ismerjük, akkor a megfelelő t-próba csak abban 
az esetben alkalmazható, ha feltehetjük, hogy a két változó — előttünk ismeret- 
len — szórása megegyezik. A két szórás egyezését elméleti meggondolások igazol- 
hatják vagy előzetes tapasztalataink indokolhatják. Ha ezt nem feltételezhetjük, 
akkor a szórások egyezéséről az F-próba alapján dönthetünk. Ha a szórások nem 
egyeznek meg, a t-próba helyett a Welch-próbával ellenőrizhetjük a várható értékek 
egyezésére vonatkozó hipotézisünket. 
Legyen £ és n normális eloszlású független valószínűségi változók c1—cs szó- 
rással és vizsgáljuk meg a 
Ho: M(Ó) — M(0) 
nullhipotézist a ő-re vett ri elemű és az y-ra vett m elemű minták alapján. Jelöljük a 
£-re vett minta átlagát x-szel, az 1-ra vett minta átlagát y-nal. Ha a nullhipotézis 
igaz, akkor a 
ze szzeze ző sssátésé 
s V1/n34-1/m 


valószínűségi változó n-4-m—2 paraméterű Student eloszlást követ, ahol s a különb- 
ség standard derivációja, 

2 - (n—1) s£3-(m— 1) s3 

I n1m—2 j 


Az előbbi képleteket összevonva, átalakítás után a következő kifejezést kapjuk : 


; ,- X17-Xz ( nm(n-t-m—2) jő 
ne agnei ű 
V(n—1) s59--(m—1) s2 nim 


A kétoldali alternatíva esetén, tehát ha az ellenhipotézis 
H.: M(Ő) 7 MO, 


akkor 1,:m-a—t. esetén a nullhipotézist elvetjük. f, az e szignifikanciaszinthez és 
n1m—2 szabadsági fokhoz tartozó érték. i 
Ha ellenhipotézisünk 
HI: M(Ó) — Mn), 


akkor az alternatíva egyoldali, és a nullhipotézist 
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t. — tIh4m-2 esetben vetjük el. 


Welch-próba 


Ha a £ és n független normális eloszlású valószínűségi változók, czy és cs szórásai- 
nak egyezését nem tételezhetjük fel, ill. az F-próba szerint c150c9, akkor a 


Ho: M(Ó — MM) 


nullhipotézis vizsgálatára a kétmintás t-próba nem alkalmazható, sőt ilyen esetben 
cgzakt próba a kérdés vizsgálatára nem is adható. A kérdés eldöntésére Welch a 
következő statisztikát ajánlja : 


ahol x;, ill. Xx a é-re vett n elemű és n-ra vett m elemű minták átlaga, s? és 53 a É és n 
tapasztalati szórásnégyzetei. A tr statisztika a Hg hipotézis fennállása esetén köze- 
lítőleg Student eloszlást követ f szabadsági fokkal, ahol f értéke a következő módon 
határozható meg: 


Legyen 
53 
om 
S24es SE. sg 
nm 
akkor 
LIBAÁNNRNB szag (1—o)? 


f — m—Il n—-1 


Ily módon ha f-et meghatároztuk, a t-eloszlás táblázatából a megfelelő szignifikan- 
ciaszinthez tartozó kritikus értékek leolvashatók. A próba használata (ellenhipoté- 
zisek, kritikus tartomány kijelölése) azonos a t-próbáéval. (A Student eloszlás kri- 
tikus értékeit a Melléklet 2. táblázata tartalmazza.) 

A kétmintás t-próba és Welch-próba alkalmazása, beleértve a megfelelő progra- 
mok használatát is, minden szempontból azonos, ezért használatukat egyetlen pél- 
dán mutatjuk be. 


Tegyük fel, hogy két szállítmány vasérc érkezett egy vaskohóba. A vasérc man- 
gántartalma mindkét szállítmányban kismértékben szór, de a szórások lényegében 
megegyeznek. (A Fisher-próbával végzett vizsgálat is ezt mutatja 596-os szignifi- 
kanciaszinten.) Mindkét szállítmányból 10 elemű mintát veszünk. A minták man- 
gántartalmára (4) a következő értékeket mértük : 


A szállítmány: 39 37 35 41 34 35 40 38 32 37 
B szállítmány: 32 30 341 34 30 34 36 33 34 28 


Kérdés: azonosnak tekinthető-e a szállítmányok mangántartalma, statisztikai ér- 
telemben van-e a mangántartalmak között szignifikáns eltérés 954-os megbízható- 
sági szinten? Mi az a legkisebb szignifikanciaszint, amin a két szállítmány mangán- 
tartalma még éppen különbözőnek tekinthető? A kérdések megválaszolására a 
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STATISZTIKAI PRÓBÁK menüjéből az EGY- ÉS KÉTMINTÁS T-PRÓBA, 
valamint WELCH-PRÓBA programot választjuk ki. Mivel 2 mintánk van, de a 
szórások lényegében megegyeznek, ezért a KÉTMINTÁS T-PRÓBA alprogramot 
hívjuk. Az adatokat akár egy lemezen előkészített file-ból, akár billentyűzetről is 
bevihetjük. A program azt is megengedi, hogy ha már korábban kiszámítottuk az 
egyes minták átlagát és szórását, közvetlenül ezeket a , szekunder"? adatokat adjuk 
meg, vagy a minták elemszámának megadása után rendre begépeljük az egyes 
minták mérési eredményeit. Ha a kiindulási adatokat megadtuk, a program meg- 
kérdezi, hogy egy- vagy kétoldali próbát kívánunk-e alkalmazni. Mivel mindegy 
számukra, melyik várható érték nagyobb, ezért természetesen kétoldali próbát kell 
alkalmaznunk (hiszen az ellenhipotézis a két szállítmány mangántartalmának, azaz 
valódi értékének különbözősége). 

A megbízhatósági szintet 954-ban rögzítve, a képernyőre a következő eredményt 
írhatjuk ki: 


KÉTOLDALI HIPOTÉZIS ESETÉN 
T-ÉRTÉK 52.987 j 
954-OS MEGBÍZHATÓSÁGI SZINTEN A HIPOTÉZIST EL KELL VETNI. 
SZABADSÁGI FOK —18 ESTE 
KORR. TAPASZTALATI SZÓRÁSNÉGYZETEK 
1. MINTÁNÁL: 0,0862 
2. MINTÁNÁL: 0,0672 


A program által adott döntést egyszerűen ellenőrizhetjük a Melléklet 2. táblázatá- 
nak használatával. 594-os szignifikanciaszinten a 18 szabadsági fokú Student elosz- 
lás kritikus értéke 2,101. Mivel a számított f érték 


tig — 2.987 — to.0548 — 2,101, 


a nullhipotézist, azaz a két minta mangántartalmainak azonosságát el kell vetni. 
A két mangántartalom 59-os szignifikanciaszinten különbözőnek mondható. (Sőt, 
a táblázat adatainak vizsgálatával még az is kiderül, hogy még 0,54-os szignifi- 
kanciaszinten is meg tudjuk különböztetni a két átlagértéket, mert to.0954s—2.88.) 


4.4.5. Konfidencia intervallum kijelölése 


Az u- és t-statisztika alkalmazásával kapcsolatban külön ki kell térnünk egy fontos 
fogalomra: a konfidencia intervallum fogalmára. 

Eddigi tárgyalásunkból tudjuk, hogy a számtani átlag a várható érték becslésére 
vonatkozó statisztika, a szórást pedig a korrigált tapasztalati szórással (standard 
deviációval) becsülhetjük. Ezek a becslések egy-egy konkrét számot adnak, nem 
mondanak azonban semmit a kapott becslés bizonytalanságáról. Nem tudjuk tehát, 
hogy ha kiszámítunk egy átlagot egy 10 elemű minta alapján, akkor mennyire bíz- 
hatunk abban, hogy újabb 10 elemű mintát véve ugyanazt az átlagot kapjuk, ili 
nem tudhatjuk, hogy a régi átlaghoz várhatóan mennyire lesz közel az újonnan ki- 
számított. Ezért a számtani átlag ún. pontbecslése a várható értéknek, a standard 
deviáció pedig a szórásnak. 

Statisztikai értelemben megalapozottabb lenne olyan becslést adni, hogy az illető 
kiszámított próbastatisztika a valódi értéknek milyen környezetébe kell hogy essen 
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az adott valószínűséggel. Ilyen becslés is lehetséges, az ilyen becslést intervallum- 
becslésnek nevezik a statisztikai irodalomban. Az ezzel kapcsolatos eljárás a kon- 
fidencia intervallum kijelölése, azé az intervallumé, amelybe a valódi értéknek (adott 
valószínűséggel) bele kell esnie. Konfidencia intervallumot mind az u-statisztika, 
mind a t-statisztika használatával kijelölhetünk. Ha a sokaság szórása ismert, az 
u-statisztikát (tulajdonképpen a standard normális eloszlás eloszlásfüggvényét), ha 
a sokaság szórását is a mintából becsültük, akkor a t-statisztikát (a Student elosz- 
lás eloszlásfüggvényét) használjuk a konfidencia intervallum kijelölésére. 

Ismert szórású, normális eloszlású sokaságból vett minta esetén ugyanis az egy- 
mintás u-statisztika képletét átrendezve a következő egyenlethez jutunk: 


azaz 


Egs ís ki k k az détszágő ; : [ed 4 
Az utóbbi egyenlet szerint a sokaság várható értéke a mintaátlag u — sugarú 
n 
környezetébe kell, hogy essen az u érték számításánál felhasznált e szignifikancia- 
szint esetén 1—e megbízhatósággal. 
Ha a sokaság szórása ismeretlen, és azt is a minta alapján becsültük, akkor az egy- 
mintás t-statisztika képletéből kell kiindulnunk a konfidencia intervallum kijelölé- 
sénél: 


azaz 


vagyis a sokaság várható értéke 1—£ megbízhatósági szinten a mintaátlag 


alz err környezetébe kell, hogy essen. 
n 


Nézzünk most mind az u-, mind a t-statisztika alapján számított konfidencia 
intervallumra egy-egy példát. 


a) A 4.4.1 pontban leírt példában egy folyóvíz higanytartalmára vonatkozó hipo- 
tézist ellenőriztünk. A minták átlagos higanytartalma 1,985 ug/l volt, a (valódi) 
szórás 

c — 0,04 g/l. 


Számítsuk most ki, hogy az eredeti feladat feltételei mellett a mintára kiszámított 
x-1,985 érték milyen környezetébe esik a várható érték 9596-os megbízhatósággal! 
Válasszuk tehát az EGYMINTÁS U-PRÓBA menüjéből a 
MEGBÍZHATÓSÁGI INTERVALLUM KISZÁMÍTÁSA (M) 


programágat, és adjuk meg ismét a 959-ot mint megbízhatósági szintet. A képer- 
nyőn a következő eredmény jelenik meg: 
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A KONFIDENCIA INTERVALLUM 954-OS MEGBÍZHATÓSÁGI 
SZINTEN 


1,98571-9,8 - 1072. 


Ez azt jelenti számunkra, hogy a várható érték 954-os megbízhatósággal az 1,975— 
1,995 intervallumba esik. A. 2,0-ás érték ezen kívül esik, ezért a nullhipotézis elutasí- 
tása mindenképpen jogos volt. 

Fel kell azonban hívni a figyelmet arra, hogy ha ugyanezt az átlagértéket 28 mérés 
átlagaként kaptuk volna, akkor a konfidencia intervallum felső határa éppen 2 
lenne, ezért a nullhipotézist el kellene fogadni. Erről könnyen meggyőződhetünk, 
többféle módon is. Egyik lehetőség, ha a MÉRÉSEK SZÁMÁNAK MEGHATÁ- 
ROZÁSA (N) ágat választjuk, és konfidencia intervallum szélességeként 0,015-et 
adunk meg. Ekkor a képernyőn a következő eredmény jelenik meg: A MÉRÉ- 
SEK SZÁMA —28. 


b) A 4.4.3 pontban az egymintás t-próbával kapcsolatban idéztünk egy példát, 
amelyben egy cellulózüzemben a szulfitlúg lúgossági számára vonatkozó nullhipoté- 
zist kellett ellenőriznünk. A minta átlaga 9 mérés alapján 11,43 volt, a korrigált 
tapasztalati szórásnégyzet pedig 0,245. 

Kérdés, hogy mit mondhatunk most a lúgossági szám várható értékéről 9596-os 
megbízhatósággal? Erre a kérdésre is könnyen válaszolhatunk, ha most az egy- 
mintás t-próba menüjéből a MEGBÍZHATÓSÁGI INTERVALLUM MEGHA- 
TÁROZÁSA programágat választjuk. Itt újra meg lehet adni a megbízhatósági 
szintet (954), és a képernyőn megjelenik a következő eredmény : 


A KONFIDENCIA INTERVALLUM 954-OS MEGBÍZHATÓSÁGI 
SZINTEN : 
. 11,43 -£0,38 
SZABADSÁGI FOK E KEKE —8 
KORR. TAPASZTALATI SZÓRÁSNÉGYZET —0,245 


A válasz szerint a lúgossági szám várható értéke a (11,05, 11,814 intervallumba 
esik 954-os valószínűséggel. Érdemes megjegyezni, hogy a párhuzamos mérések, 
amelyeket a pontosabb és megbízhatóbb eredmény érdekében végzünk, lényegében 
a Student eloszlás alkalmazásával végzett konfidencia intervallum kijelölésre vezetnek. 
Ha valaki egy uszoda vizének klórtartalmát vagy egy mezőgazdasági termék hoza- 
mát 5-ször egymás után megméri, akkor ezt nem azért teszi, hogy az illető 5 elemű 
mintára kelljen szorítkoznia megállapításának, hanem a mérési eredmény átlagának 
és szórásának megadásával az eredeti jelenséget (az uszoda vizének klórtartalmát 
vagy a termékhozamot) szeretné jellemezni. Az ismételt mérésekből származó ered- 
mény korrekt megadási módja ezért a következő: Legyen a mérendő változó x, 
tegyük fel, hogy kiszámítottuk a mérések alapján számtani átlagát (x) és szórását 
(5). Ekkor a mérési eredmény megadásának korrekt módja : 


bes S 
XTET Ged vn" 


ahol t,.-1,.) az e szignifikanciaszinthez és n—1 szabadsági fokhoz tartozó kritikus 
érték. (Itt természetesen mindig kétoldali próbáról, ezért kétoldali szimmetrikus 
tartományról van szó.) 


Végül megemlítendő, hogy mivel az átlag szórása s/Vn, ez az érték a minta 
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elemszámának (a párhuzamos mérések számának) növelésével csökkenthető. Ezért 
érdemes foglalkozni azzal a kérdéssel, hogy adott terjedelmű megbízhatósági in- 
tervallumhoz milyen elemszámú minta (hány párhuzamos mérés) tartozik. 


T-STATISZTIKA 


A változók listája: 


N, M. —  mintacsoportok elemszáma, 
X(D, Y(D — mintacsoportok elemei, 
S1, S2 — elemek összegzése, 
M1, M2 — elemek átlaga, 
81, 02 — korrigált tapasztalati szórásnégyzetek, 
P — várható érték, 
R1, R2, O, C, F, H, W(D) — részeredmények, 
T — t-érték, 
D — szabadsági fok 
A — konfidencia intervallum (számított), 
R — konfidencia intervallum (megadott), 
G — mérések száma, 
i 18 — segédváltozó, 
B — megbízhatósági szint, 
K(D, L) — t kritikus értékei, 
e — egy- vagy kétoldali hipotézisnél választás, 
OX, OY — adatmátrixból kijelölt oszlopok száma, 
D$ — menünél választás, 
A$ — Igen-Nem választás, 
BS — egymintás t-próba menüjénél választás, 
ID — kiíratásnál választás (képernyő vagy nyomtató), 
N$ — adatfile neve, 
HS, HNS, S, SZ — lemezhiba ellenőrzése. 
Programmagyarázat : 
100: Programcsomag-szervezés. 
110—240: A program. 
240—410: DATA: t kritikus értékei. 
420: T kritikus értékeinek beolvasása. 
430—570: Menű kiírása, választás, elágazások. 
580—1420:  Adatbevitel. 
1430—1670:  Egymintás t-próba almenüjének kiírása, választás, elágazások. 
1680—1710:  T-érték kiszámítása. 
1720—1750:  Megbízhatósági intervallum kiszámítása. 
1760—1860:  Mérések számának meghatározása. 
1870—1890:  Kétmintás t-próba számítása. 
1900—1930:  Welch-próba számítása. 
1940—1990: Egyoldali vagy kétoldali hipotézisre választás, elágazás. 
2000—2100:  Szubrutin megbízhatósági szint választására kétoldali hipotézis 
tén. 
2110—2210:  Szubrutin megbízhatósági szint választására egyoldali hipotézis 
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tén. 


€ese- 


ese- 


2220—2740: Eredmények kiírása választás szerint képernyőre vagy printerre. 

2750—3050: A program által nyújtott lehetőségek rövid ismertetése. 

3060: Visszatérés a FŐMENÜ c. programra. 

3070—3540: — Adatbeolvasás lemezről és a vizsgálandó mintacsoportok kijelölése. 
Közben lemezhiba ellenőrzése a 3550-es szubrutinnal. 

3550—3660:  Lemezhibát ellenőrző szubrutin. 

3670—3770:  Várakozó szubrutin. 

3780—3850:  Várakozó szubrutin Igen-Nem válaszra. 


Te ERTEKET "E 
THEM TscH1-PÍ/ZSOR(G/HI 
s3i 


FELSZELESSEGET !" 
"GOT 1788 
REI 


jatek HESZRDREK He SEL HÜ H-1 7 
"e Hi 


A THEM Ts(Hi-HZI REL /MAZSMA 
AZ HETZEMET 


gettásárégi 
; 31 THEM Iz 
T:PRIHTMEGYOLDALI 412 VEGY KETÜLDAÖLI £3? HIFOTEZISRŐL YAH szü?" 


2 
PRINT:FRIHT"HENY 87 MHEGEIZHATÓSAGI SZINTET VÁLÁSZTAT " 
TSA LEHETOSEGEK : 3£ 27 aaa 39353959.5.39.393 


H HÉ :1 
(AH EZSSS AHIL ESZE, 9 AMI EZSZ AHD ESZSS.53 AHD EZSSS.SZ THEM 292 


3.95 THEM L58 


T:ERIHT"HAHI 

PEINHT"F LEHE 

IHPUT B 
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SZINTET  VALASZT?" 


je 
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4.5. Szórások összehasonlítása 


4.5.1. Két szórás összevetése: F-próba (Fisher-próba) 


Két független, normális eloszlású valószínűségi változó szórásának összehasonlítá- 
sára alkalmas. A nullhipotézis itt arra vonatkozik, hogy a két normális eloszlású 
ismeretlen várható értékű sokaság szórása azonos, azaz: 


Elzs 04 5 0s 


ahol cz az egyik, c. a másik sokaság szórása. Ha Hg igaz, akkor a két sokaságból 
vett w, ill. m elemű mintából s; , ill. 52 korrigált tapasztalati szórásnégyzetek hánya- 
dosa F eloszlást követ, n—1 és m-—1 szabadságfokkal: 


Ezt a valószínűségi változót használjuk a nullhipotézis ellenőrzésére. Megjegyezzük, 
hogy az F értékek kiszámításánál mindig a nagyobb szórásnégyzet kerül a szám- 
lálóba. Ez egyszerűsíti a próba elvégzését és a kritikus értékek táblázatos megadását; 
tulajdonképpen ekkor mindig a 


HÚ: sv 


ellenhipotézissel szemben vizsgáljuk a nullhipotézis érvényességét, azaz mindig egy- 
oldali próbát végezhetünk. Ha az s5í/s3 hányados jóval nagyobb, mint 1, nyilván 
valószínűtlen, hogy a nullhipotézis igaz lenne. 

Az F-eloszlás kritikus értékeit a Melléklet 4. táblázata tartalmazza. Ezek a kritikus 
értékek a szignifikanciaszinten kívül a számláló és a nevező szabadsági fokától 
(n—1, ill. m—1 értékétől) is függenek. Ez ,.3-dimenziós" táblázatot jelentene, 
ezért egy-egy táblázat egy adott szignifikanciaszinthez tartozik. 

Nem nehéz belátni, hogy ha mind a számláló, mind a nevező szabadsági foka 
kicsi, már , megengedhető" az, hogy , véletlenül?" más szóráshányadost kapjunk. 
Ez azt jelenti, hogy adott szignifikanciaszintnél a szabadságfokok csökkenésével nő 
a táblázatban szereplő F,;: értéke. 

A próba használatával kapcsolatban megjegyezzük, hogy ha a kisebb szórást 
írnánk a számlálóba, akkor a táblázatos értékeket úgy kellene használni, hogy az 
előírt értéknél kisebb szóráshányados esetén kellene a nullhipotézist elutasítani. 
Ilyenkor az 


F(1—e, n—1, m—1) — ke (e, m—1, n—1) 


számítási formulával kellene a kritikus értékeket átszámítani. 

A próba használatának bemutatására tekintsük ismét a kétmintás t-próbánál 
szereplő példát: két független, 10 elemű mintánk volt, 51—0,0862 és 53—0,0672 
szórásnégyzettel. A szórások összehasonlítása F-próbával csupán egy hányados ki- 
számítását és a hányadosnak a táblázatos értékkel való összehasonlítását igényli. 
Használjuk most mégis az F-próba elvégzésére írott programot, mert a program 
többet nyújt a próba egyszerű elvégzésénél. Hívjuk be a STATISZTIKAI PRÓBÁK 
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menüjéből az F-PRÓBA ÉS BARTLETT-PRÓBA programot. Ekkor a következő 
almenü jelenik meg a képernyőn: 


F-PRÓBA ÉS BARTLETT-PRÓBA 
AZ ALÁBBI LEHETŐSÉGEK KÖZÜL VÁLASZTHAT: 


F-PRÓBA (FF) 
BARTLETT-PRÓBA (B) 
ISMERTETÉST KÉREK . (DD 
VÉGE (V) 


Az F-PRÓBA menüágat kiválasztva, az adatokat lemezen korábban előkészített 
file-ból vagy billentyűzetről is bevihetjük, akár a teljes adatsor, akár a már korábban 
kiszámított szórások megadásával. 

A minták elemszámát és szórásnégyzetét megadva a következő eredmény írható 
ki a képernyőre (vagy a nyomtatóra, a felhasználó választása szerint). 


F-ÉRTÉK — j —1,283 
SZÁMLÁLÓ SZABADSÁGI FOKA—0 
NEVEZŐ SZABADSÁGI FOKA  —9 
A SZIGNIFIKANCIASZINT — 358 


Mit is jelent az utolsó sorban szereplő 0,358-as szignifikanciaszint? Azt jelenti, 
hogy csak akkor utasíthatnánk el a nullhipotézist, azaz a két szórás azonosságát, ha 
35,899-os kockázatot vállalnánk az igaz hipotézis elutasítására. A szokásos 596-os 
szignifikanciaszintnél ezt nem tehetnénk meg, tehát 59-os szignifikanciaszinten (azaz 
9599-os megbízhatósági szinten) a nullhipotézist el kell fogadnunk. A két szórás 
azonosnak tekinthető. Az 594-os szignifikanciaszinthez tartozó kritikus érték 3,18. 
Mivel F.. 1 m-17 Frits 4 Ho-t elfogadjuk. 


4.5.2. Több szórás egyezésének vizsgálata: Bartlett-próba 


Két normális eloszlású valószínűségi változó szórása egyezésének eldöntésére meg- 
ismertük az F-próbát. Több normális eloszlású valószínűségi változó szórásának 
egyezését egy lépésben a Bartlett-ről elnevezett próbával vizsgálhatjuk. Nullhipoté- 
zisünk a következő : 

Hg: c(é) — a (ő?) — ... — c (ő), 


ahol é€7, €?, ..., ér k db normális eloszlású valószínűségi változó. Tekintsük az 
egyes valószínűségi változókra vett nm, A, ..., nn elemű mintákat, és legyenek a 
mintákból számított korrigált tapasztalati szórásnégyzetek rendre; 


2 2 2 2 
Sn15 5n2s Sngo ...g S si 


k 
Vezessük be az f;—n;—1 (i—1, 2, ..., k) ésaz f— 2 f; jelöléseket. Az f; értékekkel 
1-1 
súlyozott összesített szórás: 


pen 


k 
si - f í 2 JS Sze 
Bartlett kimutatta, hogy a 


gs 2 ZÁS 


(71853— 3 /ilg sz) 
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valószínűségi változó közelítőleg 7? eloszlást követ k—1 paraméterrel. A képletben 
a Ig a 10-es alapú logaritmust jelöli, míg 


8 egér lázezt 


A közelítés akkor jó, ha minden i-re n,—4 j—1, 2, ..., k. A nullhipotézist (1—8) 
megbízhatósági szinten akkor fogadjuk el, ha a x? próba táblázatából kikeresve a 
X(k—1, 1—8) kritikus értéket, a K?—7? reláció teljesül. A próbát leggyakrabban 
a szórásanalízis előkészítő lépéseként alkalmazzák. A próba elvégzésére készített 
program illusztrálására tekintsük a következő példát: 

Egy műtrágya nitrogéntartalma 2094. 5 egymást követő napon 12—12 zsák 
műtrágyát kiválasztva, elemezték a műtrágyát. A műtrágyák átlagos nitrogén- 
tartalma és a nitrogéntartalom szórása az 5 db 12 elemű sorozatnál a következő- 
képpen alakult: 


i Í. 2. 3. 4. Di 
X; 18,73 21.20 19,73 20.34 19.81 
SZ 3,06 1397 352 3.05 2598 


A várható értékek összehasonlításáról a szórásanalízisben bővebben lesz szó. Elöl- 
járóban csak annyit, hogy a szórásanalízis alkalmazásához igazolnunk kell, hogy 
az egyes minták szórásai azonosak. Válaszoljunk tehát most arra a kérdésre, hogy 
a különböző napokon gyártott műtrágyák nitrogéntartalmának szórása megegyező-e? 

Hívjuk be tehát a STATISZTIKAI PRÓBÁK menüjéből az F-PRÓBA ÉS 
BART LETT-PRÓBA programot és válasszuk a képernyőn megjelenő almenüből a 
BARTLETT-PRÓBA programját. A képernyőn megjelenő kérdésekre válaszolva 
gépeljük be a minták számát (5), az egyes minták elemszámát (12) és számított 
szórásnégyzeteiket. Válaszképpen a képernyőn (vagy a felhasználó kívánsága sze- 
rint a nyomtatón) a következő eredmény jelenik meg: 


KHI-NÉGYZET  — —2.4069 
SZABADSÁGI FOK —4 
A VALÓSZÍNŰSÉG —0,3386 


A kiírt valószínűség azt jelenti, hogy a nullhipotézist, azaz a szórások azonosságát 
csak 33,8694-os szignifikanciaszinten vethetnénk el. A szokásos 596-os szignifikan- 
ciaszinten a Melléklet 3. táblázata szerint a y? kritikus értéke 9.488. Mivel a számí- 
tott khi-négyzet érték, 2,4069—-9,488—78., a szórások azonosságát elfogadjuk. 


F-PRÓBA ÉS BARTLETT-PRÓBA 


A változók listája: 


L — vizsgálandó mintacsoportok száma, 
N(D — a mintacsoportok elemszáma, 

X(I, J — a mintacsoportok elemei, 

Ss(D — a mintacsoportok elemeinek összegzése, 
G(D — -próbánál a szabadsági fok, 

M(D — a mintacsoportok elemeinek átlaga, 
(el) — korrigált tapasztalati szórásnégyzetek, 
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Y — f-érték, 

K — khi-négyzet értéke, 

F, R(D, P, D, W, H, C — részeredmények, 

PP — f-próbánál a szignifikanciaszint, 

A, B, FI, A1, BI, Z — f-eloszlás számításánál a változók, 

J, A, B, S, T, WW — khi-négyzet eloszlás számításánál a változók, 

M, N — lemezről beolvasott adatmátrix oszlopainak és sorainak 
száma, 

OX — adatmátrixból kijelölt oszlop száma, 

D$ —  menünél választás, 

A$ — Igen-Nem választás, 

ID — kiíratásnál választás (képernyő vagy nyomtató), 

N$ — adatfile neve, 


HS, HN$, S, SZ 


—  lemezhiba ellenőrzése. 


Programmagyarázat: 


100: 
110—240: 
250—390: 
400—660: 
670—1040: 
1050—1140: 
1140—1350: 
1360—1450: 
1460—1610: 
1620—1960: 
1970—2180: 
2190: 
2200—2620: 
2630—2740: 
2750—2850: 
2860—2930: 


Programcsomag-szervezés. 
A program neve. 

Menü kiírása, clágazások. 
Adatbevitel billentyűzetről, 
számítása. 

Adatmátrix kiíratása. 
F-érték kiszámítása. 

Az f-értékhez tartozó valószínűség kiszámítása. 

Khi-négyzet kiszámítása. 

A khi-négyzethez tartozó valószínűség kiszámítása. 

Eredmények kiírása választás szerint képernyőre vagy nyomtatóra, 
A program által nyújtott lehetőségek rövid ismertetése. 

Visszatérés a FŐMENÜ c. programra. 

Adatbeolvasás lemezről és a korrigált tapasztalati szórásnégyzet ki- 
számítása. Közben lemezhiba ellenőrzése a 2630-as szubrutinnal. 
Lemezhibát ellenőrző szubrutin. 

Várakozó szubrutin. 

Várakozó szubrutin Igen-Nem válaszra. 


korrigált tapasztalati szórásnégyzet ki- 
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4708 EETTÁER ESEK REMEKE TEK ESTE 
488 REF 
499 REM ADATBEWYITEL BILLENTtT IJZETRŐL- 
5389 REM 
510 REMEKRKEBEEREKEKEEEEE kk kk hé 
528 FRINT:FRIHT"A TELJES HURT: ORT KIVANJFI BEVIHMI Sa" 
538 FRINT"VAGY HAR KISZAMITOÓOTTA A SZORASO(CKRIT £H23":GÖSUE 2918:Ct-Aik 
348 FRIHT 
550 FRINT 
I68 Fzg 
578 FOR Isi TO L:5(15-B 
7) PRINT:PRIMTI;5", MINTA ELEHZSZRHRE" ; : IHFUT H 
az OR M-2BG DR MEZINTL(H? THEH PRIHT"Z ES za9 KÜZTI EGESZI":GÜTű 584 
:G€éI5:M-1i:FsFABCI2:FRINT 
M" THEN IMPUT"A KORR. TAF. SZORAZHEGYZET "Et I2:GÜTTŰ SEB 
H 


TE 
539 PRINT"KEYGJ" NI; Net: TIHFUT XEJ.I) 
649 5(IOSS(IDHRAKI. 13: J:MCID-5€197MHfI5:R(I5:5B 
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L138 "zá(2i/fei) 

tid8 WzG(19:GÉlLöSGéz?:G(é 
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1169 IF Y-ZI THEM 1218 
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IF vci THEM 1348 
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AEKAIHT: 
IF INT(tL- 
Sz1ES7:IF 
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K7l4 
". ABBAL THEM 18780 


5. SZÓRÁSELEMZÉS 


A szóráselemzés alapgondolata R. A. Fisher nevéhez fűződik. Segítségével eldönt- 
hető, hogy egy vagy több adott tényező (ún. faktor) gyakorol-e ténylegesen hatást 
valamely kísérlet eredményére (összehasonlító kísérletezés). 

Néhány probléma, amely a szóráselemzés segítségével megoldható : 


a) Több szennyvíztisztítási technológiával azonos minőségű szennyvizet tisztítunk. 
Tudni szeretnénk, hogy ezen technológiák által kibocsátott szennyvíz valamely 
paramétere ugyanazon érték körül ingadozik-e. 


b) Háromféle korrózióvédő festéket kell összehasonlítanunk korrózióállóság szem- 
pontjából, háromféle minőségű acélra felhordva. A korrózióállóság megítélésénél 
azonban szeretnénk tisztán látni, hogy a jobb korrózióállóság a jobb acélminőség 
vagy az eltérő festéktípus következménye. 


c) Különböző kukoricavetőmag-mintákat kell összehasonlítanunk egy termelőszö- 
vetkezetben. A szövetkezet földjei azonban eltérő adottságúak. 

Előre kell bocsátani, hogy a szóráselemzésben a faktorok hatását egy folytonos 
valószínűségi változóra vizsgáljuk, s kikötjük, hogy a fellépő valószínűségi válto- 
zók normális eloszlásúak és azonos szórásúak legyenek. 

Példánkban több azonos szórású, normális eloszlású valószínűségi változó vár- 
ható értékének összehasonlítása a cél. Két ilyen változó összehasonlítására a t-pró- 
bát már ismerjük. Most ennek több változóra való kiterjesztését tárgyaljuk. Meg- 
jegyezzük, hogy minden lehetséges pár t-próbával történő összehasonlítása nem lenne 
célszerű, mert a döntés szignifikanciaszintje függ az összehasonlítandó kísérletek 
számától. Gondoljuk meg, hogy 596-os szignifikanciaszinten, 7 kísérlet várható érté- 
kének összehasonlítása esetén 21 t-próbát kellene alkalmazni, és annak valószínű- 
sége, hogy H; igaz, de véletlenül valamelyik páros összehasonlítás mégis szignifikáns 
eltérést mutat, 1—(1—0,05)1—0,66 (669. 

A második feladatban a változó várható értékét kétféle hatás befolyásolja: a 
bevonat és az acélminőség. Kérdés, hogy valóban léteznek-e ilyen hatások vagy sem. 
Hasonló kérdést vet fel a harmadik példa is. 

A továbbiakban feltételezzük, hogy mindig véletlen kísérletezési sorrenddel kap- 
tuk adatainkat. Ez nagyon fontos lehet az ún. módszeres hibák elkerülésében. (Pl. 
a kísérleti eredmény a műszerek kalibrációjának fokozatos eltolódása miatt sziszte- 
matikusan eltolódhat valamilyen irányban, az időjárás hatása a kísérlet eredményére 
elfedheti a vizsgálni kívánt beavatkozás hatását stb.) Feltételezzük azt is, hogy a 
kísérletező tisztában van a mérések ismételhetőségével és az ismétlések fontosságá- 
val is. 

A kísérleti eredmények összehasonlítása és az egyes faktorok kísérleti eredményekre 
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gyakorolt hatásának különválasztására gondolatban felbontjuk az egyes észlelt ered- 
ményeket a következőképpen: 


Xgj — 47-t,-ej; (i-1,2,....c; j— ll. ..., n;), 


ahol x;y a kísérlet eredménye a j-edik mérési sorozatban az 7-edik kezelés mellett; 
c az összchasonlítandó kísérletsorozatok (kezelések) száma (pl. az első példában a 
különböző szennyvíztisztítási technológiák száma); n; a mérések száma egy-egy kí- 
sérletsorozatban (kezelés során); 4 a kezelés nélküli kísérlet várható értéke; t; az 
i-edik kezelés hatása a várható értékre; e;; véletlen hiba. 

A véletlen hiba következtében fellépő szórást maradék szórásnak nevezi a szak- 
irodalom. A maradék elnevezés értelmezése az előbbi additív felbontásból nyilván- 
való: a külön-külön értelmezett individuális hatások különválasztása után meg- 
maradó, megmagyarázatlan szóródás. 

Természetesen az egyes kísérletsorozatok (kezelések) kimenetelének várható érté- 
kével is felírhatjuk a modellt: 

Xij — Hi1-8;j 
és ez esetben 


tá 
Hi — H-t; 2 t— 0. 
1-1 


A várható értéket x-sal, a u; várható értéket X;-vel becsülhetjük, és így az 7-edik 
kezelés r; hatásának becslése: f—x;—x. Az új fogalmak gyakorlására tekintsük a 
következő példát: Négy különböző gyár rugóacélt gyárt. Nevezzük a gyárakat A, 
B, C és D gyárnak. Az acél szakítószilárdságának összehasonlítására 10—10 mintát 
kértünk mindegyik gyártól, véletlenszerűen kiválasztva a mintákat egy-egy nagyobb 
szállítmányból. A kapott szakítószilárdság-értékek dimenziómentes alakra hozva a 
következők voltak : 


Gyár A w B 68 D 
55 70 70 90 
50 80 60 TS 
80 85 65 80 
60 105 75 70 
Szakítószilárdság 70 65 90 95 
75 100 45 100 
40 90 95 105 
45 95 70 90 
80 100 65 100 
70 70 75 60 
Csoportátlag, X; 62,5 86,0 70,5 90,5 
Szórásnégyzet, s? 2125 184 253,8 274,7 
Í,- Xx,—X —14,9 8,6 —6,9 13,1 


x — 77,4. 
A feladat teháta Ho: 41—42—43—4ua nullhipotézis, vagy ami ezzel egyenértékű, a 


Ha: t; 0 minden i-re nullhipotézis vizsgálata azzal a feltételezéssel, hogy a mérési 
eredmények normális eloszlásúak és az egyes kísérletsorozatokban (az egyes kezelé- 
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sek során) a szórások azonosak, azaz c1—c3—c8—o3. Ez utóbbi feltételezést a 


Bartlett-próbával ellenőrizhetjük (I. a Statisztikai próbák c. fejezetet). 


5.1. Szóráselemzés egyszeres osztályozással 


Ebben a fejezetben az előző pontban leírt nullhipotézis (ti., hogy az egyes kísérlet- 
sorozatok eredménye lényegében azonos, azaz az egyes kezelések nem befolyásolják 
a kísérletek várható eredményét) vizsgálatára mutatunk be egy módszert. A módszer 
lényege az, hogy az összes megfigyelésre együttesen kiszámított szórást két össze- 
tevőre bontjuk : 

— az egyes kísérletsorozatok átlagértékei (Xx;) és a teljes átlag (x) eltéréséből szá- 

mított szórásra (ún. csoportok közötti szórás) és a 

—- a csoportokon belüli szórásra. 

Az így értelmezett két szórás hányadosát F-próbával hasonlítjuk össze. (A tár- 
gyalásban nem térünk ki a módszer mélyebb matematikai-statisztikai alapjaira, 
de megjegyezzük, hogy a módszer a Fisher— Cochran-féle szórásfelbontási tételen 
alapul.) 

Tekintsük először az i-edik kezelés mellett kapott mérési eredmények korrigált 
tapasztalati szórásnégyzetét. Ez definíció szerint 

ú 0 XI) 


57 tási 524 1 , i — 125 eki: C, 
jsi 41 saga 


ahol c a csoportok (kezelések) száma: n; az ismételt megfigyelések száma az egyes 


e 
csoportokban. Vezessük be az n— 23 n; jelölést a megfigyelések teljes számára. 
izt 
Ha H, igaz, minden s7 ugyanannak a közös c?-nek a becslése. Az összes megfigye- 
lésre együttesen számított szórásnégyzet kiszámítható a csoportokon belüli varian- 


ciákból: 


S S Ax Úgye ay S S (x— XX) 
Ko. S ST JÉlást . (n—D 0. JáLáet 
szar iöÉ sz c n—c 


Ez az s?" mindenképpen becslése a közös c?-nek, akár igaz a nullhipotézis, akár 
nem. A csoportok közötti szórásnégyzet definíció szerint 


§ (A—9 
ei e-1 


Mivel a csoportátlagok szórása o /Vn, az előbbi szórásnégyzet c?/n becslése, 
hacsak a nullhipotézis igaz. Ezért (a nullhipotézis fennállása esetén) c?-re becslést 
kaphatunk a csoportok közötti szórásnégyzet n;-szeresével is. Jelöljük ezt .52-vel, 


2 


c n(x,—x) 
i—1 cs:1 
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Foglaljuk össze eddigi eredményeinket: Van c db független, normális eloszlású, 
azonos szórású valószínűségi változónk, €,, Ő2, ..., É.. Ezek várható értékére: 


j Ho: Hi — Ha —...— Ho; 
ill. a 

H; — UT [; 
modell felhasználásával 


Ho: ts —0 minden i-re, ia I, 2, ..., c. 


A H, ellenőrzésére készítünk két független becslést a közös c? varianciára. Ha 
H, igaz, akkor mind 5?, mind s? ugyanazon c? becslése, és az F—s2/5? hányados 
F-eloszlást követ, c—1, n—c szabadsági fokpárral. Ha H, nem igaz, 5? becslése 
lesz c?-nek, de sZ értékét az egyes csoportok közötti szisztematikus eltérések (a keze- 
lések hatása) növeli, így hányadosuk nagyobb lesz, mint a megfelelő szignifikancia- 
szinthez és ((c—1, n1—c)) szabadsági fokhoz tartozó F.,sérték. Ha F— Fefe 1,n— 0); 
akkor H,-t nem fogadjuk el, így azt mondhatjuk, hogy az egyes csoportokban a 
várható értékek különbözőek, ezért a , kezelés"? hatásosnak mondható e szignifikan- 
ciaszinten. 

A számolás megkönnyítésére és áttekinthetőbbé tételére szokás az ún. szórásfel- 
bontó táblázat elkészítése. A módszer angol nevének (ANalysis Of V.Ariance) rövi- 
dítéseként elterjedt az ANOVA betűszó használata a szóráselemzés jelölésére. 


Szóráselemzés egyszeres osztályozással 
(Egyváltozós ANOVA táblázat) 


Szóródás oka Négyzetösszeg Szabadsági fok Szórásnégyzet 
dissáát hc 6; se ú 0. 
Csoportok között Os 2 n(x —X) c—1 Sz: zt 
izi e- 
Csoportokon belüli úr c ágy fe) 
(maradék) 090— XYZ FI ú(xij—x Hé öl sg Ég 
i—-1j—1 n-c 
. öé nz 
Teljes 8—- Z 2 (xis—x)? 1—1 
1-1 j-1 


A szórásnégyzetnek az ANOVA táblázatban szereplő felbontása azzal a lényeges 
tulajdonsággal rendelkezik, hogy a teljes négyzetösszeg éppen a O; és O9, azaz a 
csoportok közötti eltérés négyzetösszeg és a csoportokon belüli, ún. maradék négy- 
zetösszeg összege, továbbá a teljes négyzetösszeg szabadsági foka éppen O), és 0, 
szabadsági fokainak összege. (Ez a tulajdonság szükséges és elégséges feltétele annak, 
hogy s? és 5? mindkettő független, y? eloszlású valószínűségi változó legyen!) 

Az állítás igazolására írjuk fel az egyes méréseknek az átlagtól való eltérését a kö- 
vetkező módon: 
x—X — (xj—X)--(X,—x). 


Emeljük négyzetre és összegezzük a kifejezés mindkét oldalát minden i, j-re : 


2 (xy — XI? s 2 (xx— XI? -- 2 (X.— XX)? 22 (x.j—XD(X— Xx). 


ij ij íj 


Vegyük észre, hogy a keresztszorzat zérus értékű, hiszen 


S pi (xj—XDGX—Xx) — Z (X.—x) Z 04— 50) 


i—-1 j—1 
td3 kJ . Ez OLY gk . [d Éd 
és 2 (xij—Xx)—0 minden i-re az átlag definíciója miatt. Ezt felhasználva éppen a 
j—1 


kívánt azonossághoz jutunk. 

A módszer illusztrálására vizsgáljuk meg a négy rugóacélgyár acélmintáira vonat- 
kozó példát, és nézzük meg igaz-e az a hipotézis, hogy a minták szakítószilárdsága 
azonos, függetlenül attól, hogy melyik gyár gyártotta azokat. Mivel a szórásanalízis 
módszere alkalmazásának előfeltétele az, hogy az egyes csoportok szórása lényegé- 
ben azonos legyen, hívjuk be először a STATISZTIKAI PROBÁK menüjéből az 
F-PRÓBA és BARTLETT-PRÓBA meniüágat. Gépeljük be adatainkat. (A rész- 
leteket illetően I. a Bartlett-próbával foglalkozó 4.5.2 pontot.) A képernyőn a követ- 
kező eredmény jelenik meg: 

KHI-NÉGYZET —-—041565 
SZABADSÁGI FOK —3 
A VALÓSZÍNŰSÉG -—0,063 


A kapott eredmény szerint a szórások csak akkor volnának megkülönböztet- 
hetőek, ha (1—0,063—93,74 kockázatot vállalnánk arra, hogy azonosak, de mi! 
mégis (az eredmény véletlen jellege miatt) különbözőnek mondjuk őket. 59-os 
kockázatvállalás (szignifikanciaszint) mellett a szórások azonosnak mondhatók, így 
a szóráselemzés elvégzésének nincs akadálya. 

Térjünk át ezért a SZÓRÁSELEMZÉS menüágra és válasszunk ki a SZÓRÁS- 
ELEMZÉS EGYSZERES OSZTÁLYOZÁSSAL programot. Adatainkat ez esetben 
is akár lemezen előkészített file-ból, akár billentyűzetről bevihetjük. 4 mintacsopor- 
tunk van (4 kísérletsorozat, 4 , kezelés"), minden csoportban 10—10 mérési ered- 
ménnyel. Az adatok megadása után a képernyőn vagy kívánság esetén a nyomtató- 
val kiíratva a következő eredményt látjuk : 


A SZÓRÁSFELBONTÓ TÁBLÁZAT 


NÉGYZET- SZABADSÁGI SZÓRÁS- 
ÖSSZEG FOK NÉGYZET 
CSOPORTOK 
KÖZÖTTI 5151,875 3 1717,292 
CSOPORTOKON 
BELÜLI 8347,500 36 231875 
TELJES 13 499,375 39 


F-ÉRTÉK — 7,40611 He 
A CSOPORTOK KÖZÖTTI ELTÉRÉS 0,084-os SZINTEN SZIGNIFIKÁNS 


A megjelenő eredmény azt mutatja, hogy a kezelések várható értékei jelentősen 
eltérnek, már 0,199-alatti szignifikanciaszinten is. (Ha ennél nagyobb kockázatot 
vállalunk arra, hogy a helyes nullhipotézist a véletlen miatt eltérő mintaátlagok 
(csoportátlagok) miatt elvetjük, akkor még inkább el kell vetnünk a várható értékek 
azonosságának feltételezését.) Az eredmény értelmezését megkönnyíti és a döntés 
jogosságát az Olvasóban megerősíti, ha a Melléklet 4. táblázatából kikeresi a (3,36) 
szabadsági fokú F elosztás kritikus értékét, mondjuk 19-os szignifikanciaszinten 


F-0.01,3,36) 5 44. 
Mivel a számított F-érték ennél nagyobb, a nullhipotézist el kell vetni. 
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SZÓRÁSELEMZÉS (EGYSZERES) 


A változók listája: 


N$ 


— a mintacsoportok száma, 

— a mintacsoportok elemszáma, 

— a mintacsoportok elemei, 

— az összes elemek száma, 

— részeredmény, 

— csoportok közötti négyzetösszeg, 

— § kerekítve, 

— csoportokon belüli négyzetösszeg, 

— §3 kerekítve, 

— négyzetösszeg összesen, 

— 52 kerekítve, 

— csoportok közötti korrigált tapasztalati szórásnégyzet, 
— csoportokon belüli korrigált tapasztalati szórásnégyzet, 
— f-érték, 

— csoportok közötti szabadsági fok, 

— csoportokon belüli szabadsági fok, 

— lemezről beolvasott adatmátrix oszlopainak és sorainak száma, 
—  mintacsoport adatmátrixbeli oszlopszáma, 

-—— Igen-Nem választás, 

— kiíratásnál választás (képernyő vagy nyomtató), 

— adatfile neve, 


HS, HN$, S, SZ — lemezhiba ellenőrzése. 


Programmagyarázat : 


100: 

110—240: 

250—1040: 
1050—1300: 
1310—1520: 
1530: 
1540—-1960: 
1970—2080: 
2090—-2190: 
2200—2270: 
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Programcsomag-szervezés. 

A program neve. 

Adatbevitel, számítások. 

Eredmények kiírása választás szerint képernyőre vagy nyomtatóra. 
A program által nyújtott lehetőségek rövid ismertetése. 

Visszatérés a FŐMENÜ c. programra. 

Adatbeolvasás lemezről. Közben lemezhiba ellenőrzése az 1970-es 
szubrutinnal. 

Lemezhibát ellenőrző szubrutin. 

Várakozó szubrutin. 

Várakozó szubrutin Igen-Nem válaszra. 


308 REMtöREEEEEEt ettek EE EESEÁSER E 


5.2. Szóráselemzés kétszeres osztályozással 


Tegyük fel, hogy egy adott növényfajta termeléséhez r-féle vetőmagot használha- 
tunk fel. Szeretnénk tudni, hogy melyik vetőmag alkalmazása adja a legjobb ter- 
méshozamot. A termelőszövetkezet földjei azonban különböző minőségűek, más a 
talaj összetétele, pH-ja stb. Ez a terméshozamokat természetesen befolyásolhatja. 
Ezért ezt a hatást szeretnénk kiküszöbölni. Úgy is fogalmazhatnánk, hogy a vető- 
magfajta hatását akarjuk tisztán értékelni, a talaj hatását pedig kiszűrni a vizsgá- 
latból. Természetesen lehetne ez fordítva is, vagy akár kíváncsiak lehetnénk mind- 
két hatásra tisztán is. Mindez a módszer szempontjából nem játszik szerepet, de 
egyszerűbb a magyarázat, ha először egyetlen hatás (faktor) vizsgálatára szorít- 
kozunk. 

Ugyancsak az egyszerűség kedvéért tegyük fel először, hogy minden vetőmag- 
fajtával, minden talajtípusban végzünk egy-egy kísérletet. Mérési adataink így táb- 
lázatos formába rendezhetők, minden vetőmagtípus és minden talajtípus kijelöli 
a táblázat egy elemét. A táblázat így kijelölt helyét cellának szokás nevezni. Azt 
mondhatjuk tehát, hogy kísérleteinket két faktor befolyásolja, adatainkat kétféle 
szempont Szerint osztályozhatjuk, és cellánként egyetlen kísérletet végeztünk. Jelöl- 
jük az egyik hatást t;-vel (az angol treatment (kezelés) szó kezdőbetűjét alkalmazva), 
a másik hatást b;-vel (az angol block szóra emlékeztetve). 

Ha feltételezzük, hogy a vetőmag fajtája és a talajtípus egymástól függetlenül hat 
a terméshozamra, akkor ezt a következő alakban fejezhetjük ki: 


üg eztttb Cs 152 sti 152 a 0); 
ahol c a vetőmagfajták száma; r az alkalmazott talajtípusok száma. 
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Az előbbi felírással egyenértékű a mérési adatokra a következő modell lesz ér- 
vényes: 
xy — ut b.4-t;--e;j (z—1,...r; j—l, ..., c). 


Természetesen 


r [d 
2 bisü; 2Ztsb 
i—1 j-1 
Feltételezzük, hogy e;; a véletlen okozta hiba, amely N(0, c) eloszlású és e;j-k 
mind függetlenek. Hipotézisünk az, hogy a vetőmagfajtáknak (kezeléseknek) nincs 
hatása a várható terméshozamra, azaz 


Ho: t; 0 minden j-re. 


Az egyszeres osztályozású szórásanalízishez hasonlóan itt is a teljes négyzetösszeg 
független négyzetösszegekre történő felbontását keressük. Az első négyzetösszeg 
a kezelések következtében fellépő változást méri, a második az egyes blokkok kö- 
zötti eltérések négyzetösszege, a harmadik a maradék négyzetösszeg. A kezelések 
következtében fellépő szórást ezután a maradék szóráshoz viszonyítjuk, a szokásos 
F-próbát használva. 

Vezessük be a következő jelöléseket: 


r 


8 1, 2 1 - 1 
X; — — KaX.; s — xijx — — 
ie c F: ijőej Fr ij rC j 


ÍM: 


É 
2 Xi j 
i—1 


[e 


Ezekkel a jelölésekkel felírható a következő egyenlet: 
Tr c 
8 — 2 €j—x — e Pz (X.—XxJ9--r 2 Gye zet 

1 J iz js 

ta (x—XI.—X.j-tX)? — 81-02-03. 
Az egyszeres osztályozású szórásanalízisnél elmondott elvek alapján az előbbi azo- 
nosság bizonyítását az Olvasóra bízzuk. A kifejezés jobb oldalán álló első tag a 
blokkok közötti eltérés mértéke, a második a kezelések közöttié, a harmadik a 


maradék négyzetösszeg. Egyszerűen belátható az is, hogy az egyes négyzetösszegek 
szabadsági fokai a következők: 


02: c—1 
Oz: (r—D(c— 1) 
O : rc—1 


Osszuk most el rendre a négyzetösszegeket szabadsági fokaik számával! 


(63 2 (X..— xx)? 


r—1] r—1 


02 Ü Pi ll 


c—L c—1 


a 
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o; Z (Xg exnexgtx]ő 
9 b : ő j 


52 — zi vi 


(r—1)(c—1) rc—1 


Belátható, hogy ezek várható értékei a következők: 


c É 


2 bi, 


ri £i 


MG) — 02- 


M(5) — 01—— 3 8, 
€c—1 j—1 
M(s5) — 0?. 


Sem a 02-t, sem O5-t nem befolyásolja, hogy a blokkok közötti eltérés négyzet- 

összege mekkora. Ha a nullhipotézis igaz, akkor minden t; érték zérus, és (55) — 
2 

—M(55), így az ő] hányados F-eloszlást követ (c—1), (r—1). (c—1) szabadsági 
3 

fokpárral, és így ez a hányados összehasonlítható adott szignifikanciaszinten az 

F-eloszlás kritikus értékeivel. 

Ha Fo 1). ec-1re-n Fé" akkor a hipotézis igaz. Ellenkező esetben szignifikáns 
különbség van az egyes vetőmagfajtákkal elérhető hozamok között, általánosan 
fogalmazva, az egyes , kezelések" várható értéke nem azonos. A kiszámítandó négy- 
zetösszegeket és szabadsági fokaikat a számítás megkönnyítése érdekében táblázato- 
san is összefoglaltuk : 

Szóráselemzés kétszeres osztályozással, cellánként 1 kísérlettel 


A szóródás oka Négyzetösszeg SZER TÉÉSEI Becsült várható érték 
Kezelés hatása c 

(oszlopok elté- r Z (x..—Xj? c—1 02 7- 2 Új 

rése) 971 c—1l j 
Blokk hatás . h 

(sorok közötti c E (x..—x) r—i Gi4 Eb 

eltérés) ES r—1 § 
Maradék 2 (xX.5—X.—X..—X)? (r—1)(c—1) 03 

ÍGY 
Teljes Z (x..— XX)? rc—1 
13 


Tegyük fel most, hogy cellánként nem egy, hanem n kísérletet végeztünk, azaz 
Xijk — Ut Di t-t; ér jr 
áltolz 701 szt JEL sss Klsssanz I 
Az előző gondolatmenetet követve levezethető, hogy a kiszámítandó négyzet- 


összegek és szabadsági fokaik a következők lesznek: 
Szóráselemzés kétszeres osztályozással, cellánként n kísérlettel 
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Szabadsági 


A szóródás oka Négyzetösszeg fok Becsült várható érték 
Kezelések hatása B én . e íj 
(oszlopok) nr z (x..—xy c—1 E TNE 2 
E; j-ic—1 
Ác ro bi 
Blokkhatás ne E (Xx.—x) r—1 0?t-nezx 
(sorok) i izi r—1 
Maradék különbségképzéssel nrc—c—r--1 6? 
Teljes B (ug exe nre—1 
i,j.k 


A vizsgált nullhipotézis és az F-próba alkalmazása a cellánkénti 1 kísérletnél 
elmondottakkal analóg. Ha Ho: tj—0 minden j-re igaz, akkor a kezelésekre vo- 
natkozó és a maradék négyzetösszegből kapott szórások hányadosa F-eloszlású, 
(c—1), (nrc—c—r-1-1) szabadsági fokpárral, és ha 


7 7krit 
Eeecájörezezrádő s 5 sak , 


akkor a nullhipotézist elfogadjuk. 

Az elmondottak megvilágítására tekintsük a következő példát: Három vetőmag- 
fajtát kell összehasonlítanunk (V,, V, és V;) és 4 különféle típusú talajon kívánjuk 
ezeket kipróbálni. Mérési adatainkat (g/hektár) a következő táblázatban foglaltuk 
össze: 


Vetőmagtlípus 
Talajtípus TENNNKET TENGEREN 
V, V.2 Vg 
118 21 28 24 
AA 18 1674 23 
3. 18 21 20 
4. 17 20 22 


A táblázatból látható, hogy cellánként egy kísérletet végeztünk. Nullhipotézisünk 
az, hogy a várható hozamok minden vetőmagfajtára azonosak. Válaszoljunk a kér- 
désre 54-os szignifikanciaszinten, ill. határozzuk meg azt a szignifikanciaszintet, 
amelyen még éppen különbséget tudunk tenni a vetőmagtípusok szerint. 

A feladat elvégzésére a STATISZTIKAI PRÓBÁK menüjéből válasszunk a SZÓ- 
RÁSELEMZÉS menüágat, abból pedig a SZÓRÁSELEMZÉS KÉTSZERES OSZ- 
TÁLYOZÁSSAL programágat. A választás hatására a program megkérdezi, hogy 
kérünk-e ismertetést. Ha kérünk, kiírja a képernyőre a módszer elvét, majd a mérési 
adatokat kéri. Ha nem, akkor egyenesen erre a pontra tér. Mérési adatainkat akár 
billentyűzetről, akár lemezen előkészített file-ból bevihetjük. A billentyűzetről való 
adatbevitelnél előbb az adatmátrix sorainak számát kéri (ez esetünkben az eltérő 
talajtípusok száma, azaz 4), majd a mátrix oszlopainak számát (a vetőmagtípusok 
számát), ami ez esetben 3. Az adatokat soronként kell megadni. 

Az adatok megadása után a képernyőn a következő eredmény jelenik meg (ill. 
nyomtató választása esetén a nyomtatóval íratható ki). 
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A SZÓRÁSFELBONTÓ TÁBLÁZAT 


NÉGYZET- SZABADSÁGI SZÓRÁS- 
ÖSSZEG FOK NÉGYZET 

Oszlop 28,17 2 14,08 
Sor 22 3 7,33 
Maradék 14,5 6 242 
Teljes 64,67 11 
F (oszlop) : 5,83 
F (sor): 3,03 


Elemezzük az előbbi eredményeket! Térjünk vissza a FŐMENÜ- höz, és válasz- 
szuk ki az eloszlás függvények menüjéből az F ELOSZLÁST! Adjuk meg először 
az oszlopok eltérésének F értékét (5,83), majd a számláló és nevező szabadsági 
fokainak számát (2 és 6). A képernyőre a következő eredmény íródik ki: 


A SZIGNIFIKANCIASZINT 0,039 


Az eredmény tehát azt jelenti, hogy az oszlopok közötti eltérés kb. 44-os szig- 
nifikanciaszinten már szignifikáns. 54-os szinten még inkább az. Így azt mondhat- 
juk, hogy a vetőmagfajtának szignifikáns hatása van a terméshozamra. 

Adjuk meg most a sorok eltérésének F értékét (3,0) és szabadsági fokait (3,6). 
Ezt könnyűszerrel, a FŐMENÜ ismételt hívása nélkül is megtehetjük, mert a prog- 
ram megkérdezi a főmenühöz való visszatérés előtt, hogy akarunk-e még más érték- 
kel is számolni. A képernyőn megjelenő eredményből megtudhatjuk, hogy az eltérő 
talajtípusok hatása csak 11,596-os szignifikanciaszinten lenne kimutatható. 596-os 
szignifikanciaszinten a nullhipotézist (azaz a talajtípusok hatásának lényegtelen vol- 
tát) el kell fogadnunk. 

Megjegyzés: A programcsomag a kétszeres osztályozású szórásanalízist csak a 
cellánként 1 kísérletet megengedő esetre tartalmazza. 


SZÓRÁSELEMZÉS KÉTSZERES OSZTÁLYOZÁSSAL 


A változók listája: 


N — az egyik faktor szintjeinek száma (a mátrix sorainak száma), 
M — a másik faktor szintjeinek száma (a mátrix oszlopainak száma), 
XCI, J) — az adatok, 

T(J), SI, 52 — részeredmény, 

S — teljes négyzetösszeg, 

SA — S kerekítve, 

Ss4 —- oszlopok közötti négyzetösszeg, 

SB —  §4 kerekítve, 

S3 — sorok közötti négyzetösszeg, 

SD — §3 kerekítve, 

S5 — eltérés négyzetösszege, 

SG — §5 kerekítve, 

VI — oszlopok közötti korrigált tapasztalati szórásnégyzet, 

SC — VI kerekítve, 

v2 — sorok közötti korrigált tapasztalati szórásnégyzet, 

SE — V2 kerekítve, 

V — eltérés korrigált tapasztalati szórásnégyzete, 
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— V kerekítve, 


I — teljes szabadsági fok, 
J — oszlopok közötti szabadsági fok, 
K — sorok közötti szabadsági fok, 
L — eltérés szabadsági foka, 
SF — §-érték oszlopok között, 
SI — f-érték sorok között, 
M,N — lemezről beolvasott adatmátrix oszlopainak és sorainak száma, 
R — a vizsgált oszlopok száma, 
O(1) — a kijelölt oszlopok, 
A$ — Igen-Nem választás, 
ID — kiíratásnál választás (képernyő vagy nyomtató), 
N$ — adatfile neve, 
HS, HN$, S, SZ — lemezhiba ellenőrzése. 
Programmagyarázat: 
100: Programcsomag-szervezés. 
110—240: A program neve. 
350—1040:  Adatbevitel, számítások. 
1050—-1340: Eredmények kiírása választás szerint képernyőre vagy nyomtatóra. 
1350—1520: A program által nyújtott lehetőségek rövid ismertetése. 
1530: Visszatérés a FŐMENÜ c. programra. 
1540—1950:  Adatbeolvasás lemezről. Közben lemezhiba ellenőrzése az 1960-as 
szubrutinnal. 
1960—2070:  Lemezhibát ellenőrző szubrutin. 
2080—2180:  Várakozó szubrutin. 
2190—2260:  Várakozó szubrutin Igen-Nem válaszra. 
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6. REGRESSZIÓ ÉS 
KORRELÁCIÓSZÁMÍTÁS 
(GÖRBEILLESZTÉS) 


A statisztikai adatfeldolgozásban gyakori feladat annak a megállapítása, hogy egy 
adott változó értéke függ egy másik változó (vagy más változók) értékétől. Az egy- 
szerűség kedvéért tegyük föl először, hogy egy változó értékét egyetlen másik vál- 
tozó befolyásolja. Tehát 2 változó értékét mérjük egyidejűleg minden mérésnél. 
Az összetartozó mért értékeket azonos indexszel látjuk el. Ha n mérést végeztünk 
te) n adatpárunk van: (xi, 1). (xa; 9), ..-, Cxas Yan); tömören fogalmazva 
X;Viji-1- 

Keressük azt a függvénykapcsolatot, amely kifejezi y függését x-től. Tipikus példa 
az ilyen vizsgálatokra a következő: Egy erdőgazdaságban fakitermeléssel foglal- 
koznak. Szeretnének egy egyszerű módszert találni a fakitermelés hozamának becs- 
lésére. Korábbi munkájukból sok mérési adatuk van: 100 esetben feljegyezték a 
kivágott fák magasságát és a fatörzs átmérőjét a vágás helyén. E két adatból a fa 
hasznos tömegét egyszerű képletekkel ki tudják számolni. A fák magasságát azon- 
ban csak a fa kivágása után lehet pontosan megmérni. Segítségünkre lehet az az 
ismert tény, hogy a telepített erdőkben a fák magassága arányos a fatörzs átmérőjé- 
vel. Így kézenfekvő a gondolat, hogy célszerű lenne a kitermelhető fatömeget a 
könnyen mérhető fatörzsátmérő méretéből becsülni. Ehhez az szükséges, hogy a 
magasság becslését az átmérő mérésére vezessék vissza. Ez a visszavetítés, vissza- 
vezetés (idegen szóval regresszió) tehát egy olyan becslő függvény megkeresését 
jelenti, amellyel az egyik változó (a függő változó) értéke becsülhető a másik vál- 
tozó (a független változó) értékének ismeretében. 

A regressziós módszerek tárgyalásánál az , alulról építkezés? módszerét követ- 
jük: egyszerűbb esetekben bemutatjuk a módszereket, majd bonyolultabb esetekre 
is kiterjesztjük a vizsgálatokat, végül bemutatjuk a módszerek hátterében megbúvó 
általános elméletet. 
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6.1. Egyváltozós lineáris regresszió a legkisebb 
négyzetek módszerével 


Tegyük fel, hogy tudjuk, két változó között lineáris kapcsolat áll fenn. Tárgyalá- 
sunk elején azt is feltesszük, hogy az egyik változó értékét a kísérletező hiba nélkül 
állítja be, ill. tudja mérni, míg a másik, a függő változó értéke azonos független 
változó értéknél is kísérletről kísérletre ingadozik, azaz valamilyen érték körül in- 
gadozva szóródást mutat. Más szavakkal, a függő változó valószínűségi változónak 
tekinthető. 

Jelölje a független változót x, a függő változót y. A két változó közötti lineáris 
kapcsolat feltételezése azt jelenti, hogy fennáll az y—a9--ajx összefüggés, ahol 
ag és az a lineáris modell paraméterei. Az egyenlet egy egyenes egyenlete. Hogyan 
lehet az egyenes két paraméterét, ag-t és az-et becsülni. 

A becslés leggyakrabban használt, legelterjedtebb módszere a legkisebb négyzetek 
elvén alapul. Jelölje ág az ag paraméter becsült értékét, á, az az paraméter becsült 
értékét, az összetartozó mérési adatokat pedig x; és y;. Az egyenes az x; ponthoz az 
491 á, x; értéket rendeli. Képezzük most a mért y; és az x; helyen számított 4y--á)ax; 
értékek különbségét: 

e; — yp—(do t- új x;). 


Az ág és á, értékét akkor határozzuk meg helyesen, ha ez a hiba, azaz a mért és 
számított értékek különbsége kicsi. Felmerül a kérdés, hogy az e, , ..., e; hibák 
milyen függvényét tekintsük a jó becslés kritériumának. A legkisebb négyzetek elve 
szerint az ag és az értéket úgy válasszuk meg, hogy az e? értékek összegének lehető 
legkisebb értékre csökkentését tűzzük ki célul: 


n n 
98— 2 e - 2 (3 (Ag úsx)y x min . 
Si ís1 90, 91 
A O négyzetösszeg az ág és ás paraméterek függvénye, ugyanis x; és v; itt már konk- 
rét számértékek. A O ág és á, szerinti minimumát úgy kapjuk meg, hogy kiszámítjuk 
ág és áj, szerinti parciális deriváltjait, azokat zérussal tesszük egyenlővé és meg- 
keressük az így kapott egyenletek ág és á, gyökeit: 


0 ÉS 

HE — 22(9—do—ájx)(— 1) — 0, 
S — 2201—úg— új x)(— x) — 0. 
Já, 


Átrendezve a következő ún. normálegyenlet-rendszerhez jutunk : 
ná tá zx; z Ly;, 
ús ZF EK EDNV 


Az egyenletrendszer az ág és áz paraméterekben lineáris. Megoldása többféle- 
képpen is lehetséges. Ha számítógéppel oldjuk meg az egyenletrendszert, akkor rend- 
szerint a következő formulákat használjuk : 
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—  NIXGYp—EX DI; 
(0 nyx5—Éxg 7" 


mm 
fi) 


4, — p—úXx. 
Belátható, hogy az á, fenti képletével egyenértékű az 


ds E(x;—Xx)(V—9) 
Z(x.,—x)j 7 
ill. az 
ú, — 2x;y.—nxy 
1 Ex1—nxi 


képlet is. Könnyen belátható az is, hogy a legkisebb négyzetek módszerével illesztett 
egyenes átmegy az (x, y) ponton, és meredeksége éppen áj; . Ezért gyakran szokták a 
két ponton átmenő egyenes analitikus geometriából jól ismert képletét is használni 
az egyenes jellemzésére : 

y—y — áj(x—x). 

Ha ág, és á, értékét meghatároztuk, tetszőleges xg értékhez kiszámíthatjuk az 
egyenesen fekvő yo pontot, azaz az y változó becslését az xg helyen feltéve, hogy xg 
a mérési pontok által lefedett intervallumba esett. (Az extrapoláció regressziós gör- 
bék esetében nem megengedhető.) 

Ha minden x értéknél több mérést végeztünk, akkor a megfelelő y értékek min- 
den x értéknél egy eloszlást adnak. Ezt a következő ábrával szemléltethetjük : 


yd 


Regresszios 
görbe 


y eloszlása x-x1-nel 


; LERKRRRRRRR 


X4 X2 X3 X 


18. ábra. Regressziós görbe 
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Ha valóban az x és y változók közötti összefüggés egyenletét találtuk meg, és 
annak paramétereit határoztuk meg, akkor a regressziós görbe az y változó feltételes 
várható értékeit köti össze. 

A regressziós feladat első problémája általában az egyenlet alakjának meghatá- 
rozása, matematikai kifejezéssel élve a megfelelő függvényosztály kiválasztása. A vég- 
telenül sokféle függvényosztály közül leggyakrabban az alábbiakat használjuk. 


— A lineáris függvények osztálya: y—agt-asx egyetlen független változó esetén, 
k 
y—-agt 2 a:x; k számú független változó esetén. 


i—1 
— A kvadratikus függvények osztálya: y—daot-a1x-tasx? egyetlen független vál- 
tozóra. 
— Az exponenciális függvények osztálya: y—age" vagy y—agx1 (egyváltozós 
eset). 


A példákat tovább sorolhatnánk. A függvényalak megválasztását elméleti megfon- 
tolások befolyásolhatják, vagy a gyakorlatban igazolhatjuk egy-egy feltételezett ösz- 
szefüggés helyességét. A gyakorlatban úgy szokás eljárni, hogy többféle egyenletala- 
kot is kipróbálunk, majd kiválasztjuk azt a függvényalakot, amely legjobban illesz- 
kedik mérési pontjainkhoz. 

Maradjunk egyelőre az egyváltozós, lincáris regresszió problémájánál. Milyen fel- 
tételeknek kell teljesülniük ahhoz, hogy a legkisebb négyzetek módszerével kapott úg 
és áz; becsült paraméterek jó becslései legyenek a valódi összefüggés ag és az para- 
métereinek? 

Lineáris regressziónál kimutatható, hogy ág és á, a valódi paraméterek legnagyobb 
valószínűségű (ún. maximum likelihood) becslései, ha fennállnak a következő fel- 
tételek : 


— a pontosan mérhető x változó minden konkrét értékénél az n valószínűségi vál- 
tozó normális eloszlású dao--azx várható értékkel és c.) szórásnégyzettel, 
— a 0(ylx) Szórásnégyzet minden x értéknél azonos, azaz x értékétől független. 


Ha a lineáris regressziós modellt ezzel a két feltétellel kiegészítjük, akkor a valódi 
regressziós egyenes, y—a9-1-ai1x éppen az 


y — M(nlx) — a97- ax 


várható értékeket összekötő egyenes. A hibával terhelt mérési adatokból számí- 
tott regressziós egyenest a valódi egyenestől való megkülönböztetés képpen 


f — 49 3-á, x-szel jelöljük. 


Az előbbi két feltételt természetesen a módszer bevezetésében, a fejezet elején is 
leírhattuk volna (mint ahogy ezt a legtöbb szakkönyv is teszi). Sokéves tapasztala- 
tunk szerint azonban ez azt a hamis látszatot keltené, hogy a legkisebb négyzetek 
módszerét egy egyenlet paramétereinek meghatározására csak akkor lehet használni, 
ha ezek a feltételek fennállnak. Ez azonban nem így van. Csupán annyit mondhatunk, 
hogy a paraméterbecslés akkor esik egybe az ún. maximum likelihood becsléssel 
(ami statisztikai értelemben egy jó, megbízható becslés) ha ezek a feltételek igazak. 
Ha például a második feltétel (a szórás függetlensége az x koordinátától) nem áll 
fenn, akkor a becslést azzal javíthatjuk, ha a kisebb szórású helyeken mért adatokat 
nagyobb súlyozó faktorral vesszük figyelembe az összegzésnél, ahol súlyozó faktor- 
ként a megfelelő x helyen vett szórás reciprokát vehetjük. 
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A regressziós egyenes statisztikai vizsgálata 


A statisztikai vizsgálat első lépéseként nézzük meg, hogyan jellemezhető az egye- 
nes illeszkedése a mérési pontokhoz! Az illeszkedés jóságának vizsgálatához bont- 


n 
suk fel az y; szórásának kifejezésében levő D(y;—Jj)? ún. teljes négyzetösszeget 
i-1 
két részre 


9- 20—92— 3 049? 3 01—5)7 — 01-40a. 


Az egyenletben f;—dgo-tálx; a becsült paraméterekkel számított y; érték az x; he- 
lyen. (A felbontás jogosságát itt nem bizonyítjuk.) 
Az egyenlet jobb oldalán 


Oz — 2 (W.—f)? 


a mért és számított y értékek eltérésének négyzetösszege. Ez az a négyzetösszeg, 
amelyet minimalizálva az 4, és áz értékeket meghatároztuk. A négyzetösszegnek ez 
már a minimuma, azaz azt mondhatjuk, hogy nem volt olyan á; és á; érték, amellyel 
ez még kisebbé tehető. Az eltérésnek ez a maradék része a regresszióval megmagya- 
rázatlan maradt. Elnevezése ezért maradék négyzetösszeg. A jobb oldal másik tagja, 


n 
8.— 2 0—))? a számított f? értékek és az j eltérése. Ez az a része a O négyzet- 
i—-1 
összegnek, ami a regresszióra vezethető vissza, amit a regressziós egyenes magyaráz 
meg. (A regressziós egyenes is átmegy az (x, y) ponton, így akár f-ot is írhattunk 
volna.) 0. neve regressziós négyzetösszeg. 

Minél jobb az egyenes illeszkedése, annál kisebb O) , ill. annál nagyobb a O,/O; 
hányados. 

Bizonyítható, hogy OC eloszlása 7? eloszlás, szabadsági foka n—1. Mivel CO; sza- 
badsági foka n—2, O; szabadsági foka 1, azaz OC) és O. szabadsági fokainak ösz- 
szege éppen O szabadsági foka, ezért O, és O., független, 4? eloszlású valószínűségi 
változók. 

Képezzük most az 


hányadost. A hányados F-closzlású, 1, n—2 szabadsági tokpárral. Ezért a hánya- 
dos 1-től való eltérésére (a Os és OC) szignilikáns eltérésére) statisztikai próbát konst- 
ruálhatunk. Nullhipotézisünk a következő : 


H,: 0. — 0. 


Ha a nullhipotézis igaz, F-eloszlása (1,n—2) szabadsági fokú  Fisher-eloszlás. 
Kijelölve egy szignilikanciaszintet, és az F-próba kritikus értékével összehasonlítva 
eldönthető, hogy Os és O) eltérése szignifikáns-e. Ha O; és O), eltérése szignifikáns, 
azaz a nullhipotézist el kellett vetnünk, akkor az egyenlet illeszkedése megfelelőnek 
mondható (idegen szóval adekvát). 

Másodszor feltehető az a kérdés, hogy a regresszió a teljes eltérés-négyzetösszeg 
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milyen hányadát magyarázza meg, azaz az összefüggés mennyire determinált. Az el- 
térés-négyzetösszeg, O egy részét a regressziós egyenesen fekvő pontoknak az átlag- 
tól való eltérésével sikerült megmagyarázni, ezt fejezi ki O2. Szokás ezért a O./O 
hányadosra a determinációs koefficiens elnevezést használni. 

A determinációs koefficiens négyzetgyöke a korrelációs együttható. Ennek bővebb 
értelmezésére még visszatérünk. 

Kimutatható, hogy a maradék négyzetösszeget, O,-et elosztva szabadsági fokával, 
éppen a 97/x szórás torzítatlan becslését kapjuk. 


A fenti kifejezés négyzetgyökét a becslés szórásának (standard deviációjának) szokás 
nevezni a statisztikai iroldalomban. 


A korrelációs együttható értelmezése 


Térjünk vissza a fejezet elején vázolt alaphelyzethez: két változó értékét szimul- 
tán mérjük, így (x;, v:y--i mérési adatsorunk van. A két változóról semmilyen 
előzetes feltevést nem teszünk, mindkettő valószínűségi változó. Legyen a két való- 
színűségi változó jele ő és n. Arra a kérdésre keressük a választ, hogy van-e közöttük 
összefüggés. Kérdésünket egyelőre a lineáris összefüggés keresésére korlátozzuk. 

A valószínűségszámításról szóló fejezetben beszéltünk a várható érték fogalmáról, 
1II. a valószínűségi változók függetlenségéről. Ha a ő és n független valószínűségi 
változók, akkor a [—M(Ó1In—M(GDI szorzat várható értéke 0-val egyenlő. Fel- 
merül tehát az a gondolat, hogy tetszőleges ő és y esetén ezek függőségét a 
c—M flE—M(ÓlIn—M(m]) várható értékkel mérjük. Ezt a c számot a £ és H való- 
színűségi változók kovarianciájának nevezzük. Attól függően, hogy milyen való- 
színűségi változókról van szó, a kovariancia —cs és --ce között bármely szám- 
értéket felvehet, a függőségnek viszont célszerű olyan mértéket választani, amely 
minden valószínűségi változó pár esetén abszolút határok közé esik. Bizonyítható, 
hogy a kovariancia abszolút értéke nem lehet nagyobb a cc, szorzatnál. A kovarian- 
ciát tehát ezzel elosztva mindig —1 és 1 közé eső számot kapunk. Jelöljük ezt a szá- 
mot 9-val, akkor: 

M(lE—M(1l1—M (DD) 
OzOn i 


0 -— 


A e neve: af és y valószínűségi változók korrelációs együtthatója. 

Ha 0—0, akkor ő és H korrelálatlanok. A korrelálatlanság azonban nem jelent 
függetlenséget. Ez a korrelációs együttható egyik hibája. Másrészt 9—1 akkor, és 
csak akkor, ha É és 4 között lineáris kapcsolat van, márpedig elegendő volna ő és n 
között egy függvénykapcsolat fennállása is ahhoz, hogy a legnagyobb mértékű függő- 
ségről beszéljünk. Így tehát a korrelációs együttható a lineáris függőség mértéke, 
de nem mértéke általában a változók összefüggésének. A korrelációs együttható 
értéke és a változók közötti kapcsolat összefüggését a következő ábrákkal szemlél- 
tetjük (az egyszerűség kedvéért két változóra). 

A korrelációs együtthatót a következő képlettel becsülhetjük : 


fsz E(x.—x) 00. —)) 
VEG —x?E0—DB 
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a) b) 


c) d) 


19. ábra. A korrelációs együttható értéke és a változók közötti kapcsolat összefüggése 
a) nagy pozitív korreláció; b) es0; c) oz0; d) kis negatív korreláció 


vagy az előbbi képlet azonos átalakításával, a szórások 


, a V2E- es s eV 28-? 
ál Ar alka s, - 


jelölésének felhasználásával 


Számítógépes számításoknál az 


fs CEE 


VEG] 


képletet használjuk. A korrelációs együttható értéke annál szorosabb lineáris kap- 
csolatra utal, minél közelebb áll abszolút értéke 1-hez. 
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Megjegyzendő, hogy a korrelációs együttható képletében szerepel a kovariancia 
becslésére szolgáló képlet is. Hé a kovariancát s.,-nal: 


5 (xx) (9. —9). 


S. 
n— €j i—1 


E. 2. Mlli 
Így a korrelációs együttható becsült értéke tulajdonképpen 


in 5Sxy 
SS 


Felvethető az a kérdés, hogy az így kiszámított r korrelációs együttható mennyire 
megbízhatóan utal a két változó közötti (lineáris) összefüggésre. Erre az r abszolút 
értéke nem mindig elegendő információ, hiszen ha csak kevés mérésünk van, és 
nincs kapcsolat a két változó között, véletlenül lehetnek olyan adatpárjaink, ame- 
lyek viszonylag nagy (pozitív vagy negatív) korrelációt eredményeznek. Kérdés, hogy 
az így kapott r érték szignifikánsan különbözik-e a zérustól. 

Ha a valódi korrelációs együttható zérus, és a mindkét változó normális eloszlású 
volt, akkor bizonyítható, hogy az 

rVn—2 


VER 


kifejezéssel definiált valószínűségi változó Student eloszlást követ n—2 szabadsági 
fokkal. Így a korrelációs együttható akkor különbözik szignifikánsan zérustól, ha 
értéke a megfelelő szignifikanciaszinten a t-próba kritikus értékénél nagyobb. Ha a 
nullától való eltérés szignifikanciája a kérdés, akkor természetesen elegendő az előbbi 
kifejezés abszolút értékét vizsgálni. Ez természetesen kétoldali próbához vezet, azaz 
ax szignifikanciaszinten, a 


Ho: [/J—0 
hipotézist akkor vetjük el, ha 


rVn—2 új 
VI af Z t(e/2,n—-2) 


Ha a szignifikanciaszintet a szokásos 594-ban rögzítjük, akkor a mintanagyság függ- 
vényében Ir] kritikus értékeire a következőket kapjuk : 


Mintanagyság w 5 w 10 w 15 w 20 w 25 J 30 w 50 w 100 


Irl kritikus értéke J 0,75 J 0,58 J 0,48 ] 0,42 J 0,38 J 0,35 0,27 0,20 


Ezzel minden szükséges előismeret birtokunkban van, ami egy egyszerű, egyvál- 
tozós lineáris regressziós példa számításához és eredményeinek értelmezéséhez szük- 
séges. Lássunk tehát egy példát! 

A különböző anyagok fajhője a hőmérséklet függvényében változik, általában a 
hőmérséklet növekedésével nő. Egy új típusú műanyag fajhőjének hőmérsékletfüggé- 
sére a következő adatokat mérték : 
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Hőmérséklet (70) 10) 10 w 20 J 30 40 


Fajhő (J/(g : "C)) J 2135 J 2,302 J 2,386 J 2,470 w 25637 


Mondhatjuk-e, hogy a fajhő a vizsgált hőmérséklet-tartományban lineárisan függ a 
hőmérséklettől. Illesszünk a mérési pontokra egyenest, ill. a 6 mérési pontra számít- 
suk kiaz y—4A--Bx egyenes két paraméterét, A-t és B-t. Az egyenes paraméte- 
reinek ismeretében becsüljük a fajhő értékét a mérési pontokban! 

A feladat elvégzéséhez a FŐMENÜ-ből az ADATFILE MŰVELETEK progra- 
mot kiválasztva először vegyük fel adatainkat a FAJHŐ nevű file-ba. (A file-ba 
történő felvétel módjára itt nem térünk vissza, erre a 7. fejezetben látunk példát.) 
Ezután a REGRESSZIÓSZÁMÍTÁS menüjéből az EGYVÁLTOZÓS REGRESZ- 
SZIÓ almenü LINEÁRIS programját választjuk a felkínált lehetőségek közül. Ezen 
a ponton kérhetünk ismertetést. Az ismertetés kérésére a következő szöveg jelenik 
meg a képernyőn: 


A PROGRAM A LEGKISEBB NÉGYZETEK ELVE ALAPJÁN LINEÁRIS 
FÜGGVÉNYT ILLESZT A MÉRÉSI PONTOKRA. A FÜGGVÉNY ALAKJA: 
Y-A--B.X. AZ EGYENES ILLESZKEDÉSÉNEK JÓSÁGÁT IS VIZSGÁLJA, 
ÉS LEHETŐVÉ TESZI TETSZŐLEGES FÜGGETLEN VÁLTOZÓHOZ TAR- 
TOZÓ FÜGGVÉNYÉRTÉK KISZÁMÍTÁSÁT A BECSÜLT EGYENES SEGÍT- 
SÉGÉVEL. 


Ezután megkérdezi a program, hogy az adatok lemezen vannak-e (1I/N). Termé- 
szetesen lemezen vannak (I) és az ADAFILE NEVE kérdésre a FAJHÓ választ 
adjuk. Betettük az adatfile-t tartalmazó lemezt. A program ennek tudomásulvétele 
után megkérdezi a 


FÜGGETLEN VÁLTOZÓ ADATMÁTRIXBELI OSZLOPSZÁMÁT 1) 
és a FÜGGŐ VÁLTOZÓ ADATMÁTRIXBELI OSZLOPSZÁMÁT 2) 


(Ezeket a kérdéseket azért teszi fel a program, hogy lehetőséget adjon más, a file- 
ban tárolt adatsorok közötti korrelációszámítására is. Például, esetünkben minden 
mérési ponthoz felvetettük volna a fajhőn kívül a sűrűség értékét is, és akkor egy 
másik regressziós számítással a sűrűség hőmérsékletfüggését vizsgálhatnánk.) 

Az adatmátrix beolvasása után kiírathatjuk azt a képernyőre vagy a nyomtatóra, 
ellenőrizhetjük, módosíthatjuk az adatfile-kezelő program használatával stb. 

A számítás eredményeit megjeleníthetjük a képernyőn vagy kiírathatjuk. Vá- 
lasszuk most az előbbi megoldást. A képernyőn a következő kép jelenik meg: 


A KÖZELÍTÉS Y—A3-BX ALAKÚ 
A —2,1516 
B—0,0117 j 
KÉRI A REGRESSZIÓS TÁBLÁZATOT?  (I/N) 


Írassuk ki a regressziós táblázatot is a képernyőre! 


REGRESSZIÓS TÁBLÁZAT 


REGRESSZIÓS NÉGYZETÖSSZEG 0,137 
SZABADSÁGI FOK 1 
NÉGYZET ÁTLAG 0,137 
MARADÉK NÉGYZETÖSSZEG 2.15511078 
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SZABADSÁGI FOK 3 
NÉGYZET ÁTLAG 9,185.107-£ 
TELJES NÉGYZETÖSSZEG 0,14 
SZABADSÁGI FOK 4 
F—149,54 2711 

DETERMINÁCIÓS KOEFFICIENS — 0.980 
KORRELÁCIÓS EGYÜTTHATÓ — — 0990 
BECSLÉS SZÓRÁSA — 0,030 


T (KORRELÁCIÓS EGYÜTTHATÓ) —12,2 
NYOMJON MEG EGY BILLENTYŰT! 


Mielőtt továbbmennénk, értékeljük az eredményeket! Az A és B paraméterek azt 
mutatják, hogy a fajhő értéke a vizsgált tartományban csak kismértékben vál- 
tozik a hőmérséklettel: 107C hőmérsékletnövekedés kell ahhoz, hogy a fajhő 
0,117 J/(g - 90-szal, azaz kb. 594-kal nőjön. Másrészt, ez a növekedés lineáris: a kor- 
relációs együttható értéke 0,99 feletti, pedig az elméleti ismertetőből tudjuk, hogy 
5 mérési pont esetén a korrelációs együttható már 0,75 felett szignifikáns 59-os 
szignifikanciaszinten. Ez (természetesen) egybevág azzal az eredménnyel, hogy a 
regressziós együttható t-próba értéke 12,2, azaz jóval nagyobb a kritikus 596-hoz 
tartozó 2,353 értéknél. 

A regressziós táblázat teljes négyzetösszegének felbontása együttesen a determiná- 
ciós koefficiensben, a becslés szórásában és az F-értékben jelenik meg. 

A determinációs koefficiens 0,98-as értéke azt fejezi ki, hogy a fajhő változásának 
kb. 989-át a hőmérséklet változására lehet visszavezetni, és a 24 a regressziós 
egyenletben figyelembe nem vett hatások eredménye. A becslés szórásának 0,03-os 
értéke (a maradék négyzetösszeg átlagértékének négyzetgyöke) azt mutatja, hogy a 
fajhő értékét 0,03-os abszolút pontossággal (szórással) tudjuk becsülni a kapott 
regressziós egyenessel. 

Az F-próba 149,54-os értéke újabb bizonyítéka az egyenes igen jó illeszkedésének 
a mérési pontokhoz, hiszen a megfelelő kritikus érték 


Booo31,3) az 10, 13 


és a kapott F-érték ennél egy nagyságrenddel nagyobb. 

A programmal kiszámíthatjuk a fajhő értékét is különböző hőmérsékleteken. Pél- 
daképpen a mérési pontokban kiszámítva a fajhőket, értéküket összevethetjük a 
mért értékeikkel: 


Fajhő, J/(g : "C) 


Hőmérséklet, "C 


Mért Számított 
[0 2.135 2,1516 
10 2302 2,2688 
20 2,386 2,386 I 
30 2,470 255032 
40 2,637 2,6204 
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Az egyváltozós lineáris regresszió könnyűszerrel továbbfejleszthető többféle irány- 
ban, többféle esetre 15: 


—- ha a függő változó nemlincáris függvénye a független változónak, azaz az Y—f(x) 
függvénykapcsolat x-ben nem lineáris ; 

— ha a függvénykapcsolat paramétereiben nem lineáris ; 

— ha a függő változó értékét több független változó is befolyásolja; 

—- ha a függő változó a független változó vagy változók valamilyen hatványaitól 
függ, de az összefüggés paramétereiben lineáris. 


Az első két esetet (bizonyos feltételek fennállása esetén) visszavezethetjük az egy- 
változós lineáris regresszióra, a második kettő a többváltozós lineáris regresszió 
ismeretét igényli, ezen belül a negyedik esetben a független változókat transzfor- 
málni kell, hogy a lineáris regresszió módszerét alkalmazni tudjuk. 


6.2. Egyváltozós lineáris regresszió a független 
váltózó vagy a függvény transzformálásával 


Abban az esetben, ha az illesztendő függvény paramétereiben nemlineáris, a lineáris 
regresszió módszere változatlan formában nem alkalmazható. Szigorúan véve az 
ún. nemlineáris regresszió módszeréhez kellene folyamodnunk. Ilyenkor a mért és 
számított értékek eltérés-négyzetösszegének a paraméterek szerinti minimumát álta- 
lában nem lehet a parciális deriváltakat zérussal egyenlővé téve meghatározni. Ha 
azonban alkalmas transzformációval a függvény paramétereiben lineárissá tehető, 
akkor a linearizált függvény konstansainak becslésére alkalmazva a legkisebb négy- 
zetek módszerét, a paraméterek meghatározására szolgáló egyenletrendszer, a nor- 
málegyenlet-rendszer lineáris lesz, így továbbra is a lineáris regresszió egyszerű 
eszköztárát használhatjuk. A konstansok meghatározása után a függvényt vissza- 
transzformálva, az eredeti összefüggést kapjuk, a benne szereplő, most már ismert 
konstansokkal együtt. Figyelemmel kell természetesen lenni arra a tényre, hogy a 
különböző alkalmas transzformációk a mérési hibák eloszlását is transzformálják, 
így a becsült paraméterek eloszlása a legvalószínűbb érték körül kissé megváltoz- 
hat. Bár a transzformációk alkalmazása ezért nagy körültekintést igényel, mindez 
nem akadályozta meg az ilyen linearizáláson alapuló regressziós mószerek elterje- 
dését. A következő táblázatban erre mutatunk be néhány példát. 


Transzformált 
Eredeti összefüggés 
függvény független változó függő változó 
Y — 4 exp (BX) — In Y- ln 4-1BX TT seg X ex 
Y Ax" - InY-1]n4-48Blnx TT a mY X -1Inx 
Y — 47--Blog X— Y — 4-7 BlogX ) eds a X sslogX 
InY—-— 44B/X — In Y — 4--BIX X  sSiiyY xx sa 1/Xx 
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A táblázat első sorában az exponenciális függvény lineáris regresszióval való illesz- 
tését látjuk. A független változót nem kellett transzformálni, a függő változót azon- 
ban igen. Ezzel a mérési hibák eloszlását is transzformáltuk. Az ilyen elven felépí- 
tett program (EGYVÁLTOZÓS REGRESSZIÓ, EXPONENCIÁLIS) elsődlegesen 
az In 4 és B értékét becsüli (természetesen nyomtatás előtt visszatranszformálva), és 
az erre a becslésre vonatkozó statisztikai táblázatot nyomtatja ki. 

A táblázat második sorában olyan függvényt láthatunk, amelyben a becsülendő 
B paraméter a független változó kitevőjében van. Ennek lineáris regresszióval való 
illesztéséhez mind a független változót, mind a függő változót transzformálni kellett. 
A függő változó transzformálásával a mérési hibák eloszlását is transzformáltuk. 
Az ezt megyalósító program (EGYVÁLTOZÓS REGRESSZIÓ, GEOMETRIAD 
elsődlegesen az In 4 és a B értékét becsüli (természetesen nyomtatás előtt vissza- 
transzformálva), és az erre a becslésre vonatkozó statisztikai táblázatot nyomtatja ki. 

A táblázat harmadik sorában olyan függvényt láthatunk, amelyben a függő vál- 
tozó a független változó (tízes alapú) logaritmusától függ. Ennek lineáris regresszió- 
val történő illesztéséhez csak a független változót kell transzformálni. A mérési 
hibák eloszlása így változatlan marad. Az ezt megvalósító program (EGYVÁLTO- 
ZÓS REGRESSZIÓ, LOGARITMIK US) közvetlenül 4 és B értékét becsüli, a para- 
métereket így transzformálni nem kell. 

A táblázat utolsó sorában egy ún. Antoine-egyenlet típusú függvény lineáris regresz- 
szióval történő illesztését látjuk. Ennek lineáris regresszióval való illesztéséhez mind 
a független változót, mind a függő változót transzformálni kellett. A függő változó 
transzformálásával mérési hibák eloszlását is transzformáltuk. Az ezt megvalósító 
program (EGYVÁLTOZÓS REGRESSZIÓ, ANTOINE) közvetlenül 4 és B érté- 
két becsült. 


EGYVÁLTOZÓS REGRESSZIÓ 
LINEÁRIS FÜGGVÉNY ILLESZTÉSE 


A változók listája: 


N — mérési pontok száma, 

X(1 — független változó vektora, 

Y(D — függő változó vektora, 

OX, OY — függő és független változó mátrixbeli oszlopszáma (lemezről történő 
adatbeolvasásnál használjuk), 

A — 0. fokú regressziós együttható, 

B — 1. fokú regressziós együttható, 

S5 — determinációs együttható, 

S6 — korrelációs együttható, " 

57 — a becslés standard hibája. 

Programmagyarázat: 

100: Programcsomag-szervezés. 


120—250: A program neve. 
. 260—720: Adatbevitel. 
730—860: A regressziós függvény együtthatóinak meghatározása. 
870—890: Az eredmény kiírási helyének kijelölése. 
900—-1020: Az együtthatók kiírása. 
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1030—1420: 
1430—1580: 
1590—1750: 
1760: 

1770—2180: 
2190—2300: 
2310—2460: 
2470—2650: 


ú REHEEEEEEEEEBEEEEEE E EE E 
A REM 
BEL EGYUTTHATOE  MEGHAÁTARÓ 


A regressziós táblázat számítása. 

A mérési pontok ellenőrzése. 

Pontok meghatározása a regressziós görbéből. 
Visszatérés a FŐMENÜ c. programra. 

Adatbeolvasás lemezről. 

Lemezhiba ellenőrzés. 

A program által nyújtott lehetőségek rövid ismertetése. 
Várakozás Igen-Nem válaszra. 


ea 
xx 


bd 


EGYVÁLTOZÓS REGRESSZIÓ 
EXPONENCIÁLIS FÜGGVÉNY ILLESZTÉSE 


A változók listája: 


N — mérési pontok száma, 

X(D — független változó vektora, 

Y(D — függő változó vektora, 

OX, OY — függő és független változó mátrixbeli oszlopszáma (lemezről történő 
adatbeolvasásnál használjuk), 

A — preexponenciális tényező, 

B — a független változó együtthatója az illesztett függvényben 

(7-4 xexp (B: X)), 

S5 — determinációs együttható, 

S6 — korrelációs együttható, 

57 — a becslés szórása. 
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Programmagyarázat : 


100: 
110—250: 
260—720: 
730—-860: 
870—890: 
900—-1020: 
1030—1420: 
1430—1580: 
1590—1750: 
1760 
1770—2180: 
2190—2300: 
2310—2460: 
2470—2650: 


Programcsomag-szervezés. 

A program neve. 

Adatbevitel. 

A regressziós függvény együtthatóinak meghatározása, a függő vál- 
tozó transzformációja Y-ln(r). 

Az eredmény kiírási helyének kijelölése, 

Az együtthatók kiírása. 

A regressziós táblázat számítása. 

A mérési pontokzellenőrzése. 

Pontok meghatározása a regressziós görbéből. 
Visszatérés a FŐNEMŰ programra. 

Adatbeolvasás lemezről. 

Lemezhiba-ellenőrzés. 

A program által nyújtott lehetőségek rövid ismertetése. 
Várakozás Igen-Nem válaszra. 


EGYVÁLTOZÓS REGRESSZIÓ 
Y— Ax? ALAKÚ FÜGGVÉNY ILLESZTÉSE 


A változók listája: 


N PEESN 
XI —— 
YJ) — — 
OX,OY — 
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mérési pontok száma, 

független változó vektora, 

függő változó vektora, 

függő és független változó mátrixbeli oszlopszáma (lemezről történő 
adatbeolvasásnál használjuk), 

együttható (Y— 4X?), 

kitevő, 


S5 —- determinációs együttható, 


S6 — korrelációs együttható, 
S7 — a becslés standard hibája. 
Programmagyarázat : 
100: Programcsomag-szervezés. 
110—250: A program neve. 
260—710: Adatbevitel. 
730—860: A regressziós függvény együtthatóinak meghatározása, a független 
és függő változó transzformációja X—-ln (X), Y—lIn (TT). 
870—890: Az eredmény kiírási helyének kijelölése. 
900—1020: Az együtthatók kiírása. 
1030—1420:  Aregressziós táblázat számítása. 
1430—1580: A mérési pontok ellenőrzése. 
1590—1750: Pontok meghatározása a regressziós görbéből. 
1760: Visszatérés a FŐMENÜ c. programra. 
1770—2180:  Adatbeolvasás lemezről. 
2190—2300:  Lemezhiba-ellenőrzés. 
2310—2460: A program által nyújtott lehetőségek rövid ismertetése. 
2470—2650: Várakozás Igen-Nem válaszra. 


t4ga 


kagi 
kek 


S3d FEMHESEEEEEEE BEEE EE EE tetette tek 


§ 
EGYUTTHATŐK  MEGHATARü k 
k 
Ede látá ál b E EE de E E EBEÉ E d 

TM N:Ssl ÜGeg elda: st ÜGÖYŰI 0 


EGYVÁLTOZÓS REGRESSZIÓ 
LOGARITMUSFÜGGVÉNY ILLESZTÉSE 


A változók listája: 


N — mérési pontok száma, 

X(D — független változó vektora, 

Y() — függő változó vektora, 

OX, OY — függő és független változó mátrixbeli oszlopszáma (lemezről történő 


adatbeolvasásnál használjuk), 
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az illesztett függvény (Y—4--B x1lg(X)), konstans tagja, 


B — a logaritmusfüggvény szorzója, 
55 — determinációs együttható, 
S6 — korrelációs együttható, 
S7 — a becslés standard hibája. 
Programmagyarázat: 
100: Programcsomag-szervezés. 
110—250: A program neve. 
330—720: Adatbevitel. 
730—3860: A regressziós függvény együtthatóinak meghatározása, a független 
változó transzformációja X—-—log(X). 
870—890: Az eredmény kiírási helyének kijelölése. 
900—1020: Az együtthatók kiírása. 
1030—1420: A regressziós táblázat számítása. 
1430—1580: A mérési pontok ellenőrzése. 
1590—1750: Pontok meghatározása a regressziós görbéből. 
1760: Visszatérés a FŐMENÜ c. programhoz. 
1770—2180:  Adatbeolvasás lemezről. 
2190—2300:  Lemezhiba-ellenőrzés. 
2310—2460: A program által nyújtott lehetőségek rövid ismertetése. 
2470—2650: Várakozás Igen-Nem válaszra. 


730 bENt HEEEREEk: EBEBEBEMBEREKKETEKEE 
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EGYVÁLTOZÓS REGRESSZIÓ — 
ANTOINE TÍPUSÚ FÜGGVÉNY ILLESZTÉSE 


A változók listája: 


N — mérési pontok száma, 
X(D — független változó vektora, 
Y( — függő változó vektora, 


OX, OY — függő és független változók mátrixbeli oszlopszáma (lemezről történő 
adatbeolvasásnál használjuk), 


A — az illesztett (In(Y)—4--B x1/X) függvény konstans tagja, 
B — a független változó reciprokának együtthatója, 
S5 — determinációs együttható, 
S6 — korrelációs együttható, 
57 — a becslés standard hibája. 
Programmagyarázat: 
100: Programcsomag-szervezés. 


110—250: A program neve. 
330—720: Adatbevitel. 
730—860: A regressziós függvény együtthatóinak meghatározása, a független 
és függő változó transzformációja X—1/X, Y—-ln (Y). 
870—890: Az eredmény kiírási helyének kijelölése. 
900—1020: Az együtthatók kiírása. 
1030—1420:  Aregressziós táblázat számítása. 
1430—1580: A mérési pontok ellenőrzése. 
1590—1750: Pontok meghatározása a regressziós görbéből. 
1760: Visszatérés a FŐMENÜ c. programhoz. 
1770—2180:  Adatbeolvasás lemezről. 
2190—2300:  Lemezhiba-ellenőrzés. 
2310—2460: A program által nyújtott lehetőségek rövid ismertetése. 
2470—2650: Várakozás Igen-Nem válaszra. 


739 ELET Áááá adádálőkökáláz s ádáákűösál áll E LÉ kllt ál 
MH4 EGYUTTHATOK MEGHATAROZAZR 8 
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6.3. Többváltozós lineáris regresszió 


Terjesszük ki egyváltozós lineáris modellünket oly módon, hogy a függő változó 
ne egyetlen független változótól függjön, hanem több független változó lineáris kom- 
binációjától. 

Példaképpen legyen 3 független, pontosan mérhető vagy pontosan ismert értékre 
beállítható független változónk, XI, Xo, X3. Az összefüggés pedig legyen lineáris : 


Y — at a, X11- a X251- a; X5. 


Annak érdekében, hogy a; (i—1, 2, 3) legnagyobb valószínűségű becslését kapjuk, 
szokás feltételezni, hogy az Y normális eloszlású és szórása az X., X., Xz koordi- 
nátáktól független. (Ahogy az előzőekben is ezt a feltételezést tettük az egyváltozós 
esetre.) 

Ha N mérést végeztünk, azaz van egy [F;, X1:, Xo:, Xs] a mérési adathalmazunk , 
ahol N-—4, az ag, az, ae, ag becslését az előző fejezetben ismertetett módon kap- 
hatjuk. Felírjuk a 


N 
2 -— 2 (Y— 44 — áj X11— do Xoj— úg Xg)? 
fa 


négyzetösszeget, és képezzük az 4, áj, ás, ász szerinti parciális deriváltakat. Ezeket 
nullával egyenlővé téve szimultán (az ág, á1, áz, ás paraméterekben) lineáris egyen- 
letet kapunk: 

49N--á,2xi;táoZxept-ásZXxg; — EV; 


áp2xi-t új Zxi;-búoZxoxi tás ZXs Xi — DVXii. 
ág Zxagtújoxxg tá Zx3 tú EXsXeg — DVXojs 
ásaxs tűzze bűz a xkaése Fás GX3 E ZJINsis 


Ennek a normálegyenlet-rendszernek a megoldása adja az úg, áz, do, áz para- 
méterek becslését. Az egyenletrendszer megoldása tetszőleges (lineáris egyenletrend- 
szer-megoldó) módszerrel végezhető. Programunk az ún. Gauss eliminációt alkal- 
mazza. A regressziós egyenlet statisztikai vizsgálata hasonló módszerekkel lehetsé- 
ges, mint egyváltozós esetben: a 0 négyzetösszeget ugyanúgy bontjuk 01 és 02-re, 
mint egyváltozós esetben, csupán a négyzetösszegek szabadsági foka változik a 
paraméterek számának változása miatt: ha a független változók száma k: 

— 01 (a maradék négyzetösszeg) szabadsági foka N—k—1; 

— 02 (a regressziós négyzetösszeg) szabadsági foka k. 

Ezt figyelembe véve, az egyenlet illeszkedését mérni hivatott F-próba hasonló módon 
végezhető el, mint egyváltozós esetben. Mivel a determinációs együttható, a korrelá- 
ciós együttható, a becslés standard deviációja és t-próbája az előbbi négyzetösszegek 
alapján megkapható, ezek ismételt felírására nincs szükség. A determinációs együtt- 
ható ez esetben természetesen azt fejezi ki, hogy az összes független változónak a 
regressziós egyenletben tükröződő változása a teljes négyzetösszegnek milyen há- 
nyadát képes megmagyarázni. A korrelációs együttható is értelemszerűen többvál- 
tozós korrelációs együtthatóvá válik. A becslés standard hibájának képletében a 
nevezőbe természetesen 01 szabadsági foka, N—k—1 kerül, és ennyi lesz a meg- 
felelő t-próba szabadsági fokainak száma is. 

Lássunk most az elmondottak illusztrálására ismét egy példát! 
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2..r 


A nitrogén-oxidokat híg salétromsavval nyeletik el. Az abszorpció nem tökéletes: 
a véggázokkal nitrogén-oxidok távoznak. Passzív kísérletekben mérték az oxidáló 
levegőáram mennyiségét (xi), a hűtővíz hőmérsékletét (x,), az abszorbersav kon- 
centrációját (amelyet a könnyebb kódolás kedvéért úgy kódoltak, hogy 50-et levon- 
tak belőle és 10-zel megszorozták) (xs), és a nitrogénveszteségből számított száza- 
lékos ammóniaveszteséget. A függőváltozó (Y) ez utóbbi mennyiség tízszerese. 21 
mérés adatait a következő táblázat tartaimazza. 


Sorszám w Xi J Xs j Xg w b áj 
1 80 27 89 42 
2 80 27 88 37 
3 79 25 90 37 
4 62 24 87 28 
5 62 22 87 18 
6 62 28 87 18 
7 62 24 93 19 
8 62 24 93 20 
9 58 23 87 15 

10 58 18 80 14 
11 58 18 89 14 
T2 58 17 88 13 
13 58 18 82 11 
14 58 19 93 12 
15 50 18 89 8 
16 50 18 86 7 
17 50 19 72 8 
18 50 19 79 8 
19 50 20 80 9 
20 56 20 82 15 
21 70 20 91 15 


Feltételezve, hogy az ammóniaveszteség lineárisan függ a figyelembe vett független 
változóktól, írjuk le Y változását x., x, és xs függvényében. 

A feladatot a REGRESSZIÓSZÁMÍTÁS programág TÖBBVÁLTOZÓS LINEÁ- 
RIS, A VÁLTOZÓK TRANSZFORMÁCIÓJA NÉLKÜL programjával oldhat- 
juk meg. 

Tegyük fel, hogy adatainkat előzőleg az adatkezelő programmal egy AMMON 
nevű file-ba tettük. Ekkor a program bejelentkezik, és megkérdezi, kérünk-e ismer- 
tetést. Ha nem kértünk, vagy már megkaptuk és továbblapoztunk, akkor megkérdezi, 
hogy adatainkat lemezről vagy billentyűzetről akarjuk-e bevinni. Esetünkben le- 
mezről. Ekkor megkér, hogy tegyük be az adatlemezt, majd ennek nyugtázása után 
beolvassa az adatokat, és megkérdezi, hogy kiírja-e az adatmátrixot. Ha ezt nem 
kérjük vagy kérjük, de már kiírtuk az adatokat a képernyőre (vagy nyomtatóra), és 
azokat megfelelőnek ítélve tovább folytattuk a program végrehajtását, akkor a prog- 
ram elvégzi a szükséges számításokat. Megkérdezi, hova kérjük az eredményeket, 
majd kiírja a választott perifériára előbb a kiszámított paramétereket, majd a reg- 
ressziós egyenlet statisztikai vizsgálatának eredményét, esetünkben a következőket: 


b(0) — —39,9196 
b()— 071564 
b(2J— 1,29529 
b(3)— —0,15212 
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REGRESSZIÓS 
NÉGYZETÖSSZEG — 1890.408 


SZABADSÁGI FOK 3 
NÉGYZET ÁTLAG 630,1 
MARADÉK 


NÉGYZETÖSSZEG 1788 
SZABADSÁGI FOK 17 
NÉGYZET ÁTLAG 10,5 


TELJES fi 
NÉGYZETÖSSZEG 2069,2 
SZABADSÁGI FOK 20 


F.-59 90227 
DETERMINÁCIÓS KOEFFICIENS — — 0914 
TÖBBSZÖRÖS KORR. KOEFFICIENS — 0.956 
BECSLÉS STANDARD DEVIÁCIÓJA — 3.243 


KISZÁMÍTSUK Y ÉRTÉKÉT KÜLÖNBÖZŐ X ÉRTÉKEKRE? 


Ez utóbbi kérdés megválaszolását az olvasó szabad belátására bízzuk. A regressziós 

egyenlet statisztikai vizsgálatából látszik, hogy 

— JT értéke jóval nagyobb a szokásos 59-os szignifikanciaszintű kritikus értéknél 
F(p, k,n—k—1) — F(0,05, 3,17) — 3,2-nél; 

— a determinációs koefficiens szerint a változás több, mint 91 96-át leírja a modell; 

— a korrelációs koefficiens elegendően nagy; 


ersz. 


TÖBBVÁLTOZÓS LINEÁRIS REGRESSZIÓ 
A változók listája: 


N — mérési pontok száma, 

M — független változók száma, 

X(I, JJ) — függő és független változók mátrixa (/—1-től N-ig, J—1-től M--1-ig 
megy). Az M7-1. oszlopban van a független változó, 

8(I,J) — az egyenlet együtthatói (Y—A(1) kX1-- 42) x X2--...14(M) x XM), 

S5 — determinációs együttható, 


S6 — korrelációs együttható, 
S7 — a becslés standard hibája, 
N$ — az adatfile neve. 
Programmagyarázat : 
100: Programcsomag-szervezés. 


110—230: A program neve. 

240—780: Adatbevitel. 

810—1030: A regressziós függvény együtthatóinak meghatározása. 
1040—1060: Az eredmény kiírási helyének kijelölése. 
1070—1210: Az együtthatók kiírása. 
1220—1600: A regressziós táblázat számítása. 
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1610—1780: A mérési pontok ellenőrzése. 

1790—1960: Pontok meghatározása a regressziós görbéből. 

1970: Visszatérés a FŐMENÜ c. programhoz. 

1980—2300:  Adatbeolvasás lemezről. 

2310—2420:  Lemezhiba-ellenőrzés. 

2430—2640: A program által nyújtott lehetőségek rövid ismertetése. 
2650—2830: Várakozás Igen-Nem válaszra. 


0 I. HH13:NEST J 


6.4. Többváltozós lineáris regresszió a változók 
transzformációjával 


Közelítés egyetlen változó hatványsorával (egyváltozós polinomiális regresszió ) 


Az előzőekben először az egy- (független) változós, majd a több- (független) vál- 
tozós lineáris regresszióval foglalkoztunk. Most ismét visszatérünk az egy- (füg- 
getlen) változós esetre, de most ennek (a független változóban) nemlineáris esetét 
visszavezetjük a többváltozós lineáris regresszió esetére. 

Tegyük fel, hogy a függő változó az (egyetlen) független változó valamilyen 
polinomjától függ. Mivel a legtöbb függvény hatványsorral jól közelíthető, ez a 
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feltételezés egyváltozós függvényeknél általában célravezető. Harmadfokú polinom- 
mal való közelítés esetén például a regressziós függvény alakja a következő lesz: 


Y — at a X1 a. X?7- a, X?. 


Az ilyen típusú regresszió teljesen hasonló módon kezelhető, mint a többváltozós 


x1—X, x2—X?, x3—X3. Az a,, az, as, as legkisebb négyzetek módszerével történő 
becslését ekkor a 6.3. alfejezetben szereplő többváltozós lineáris regressziós normál- 
egyenletekből kapjuk. 


Lineáris regresszió a független változók tetszőleges, de paramétereikben lineáris kifeje- 
zéseinek lineáris kombinációjával 


Ugyanarra a mérési adatsorra különböző regressziós modelleket kipróbálva, el- 
juthatunk oda, hogy nemcsak több változót kell figyelembe vennünk, de ezek szor- 
zatai, pozitív és negatív kitevős hatványai, sőt ezek egyéb kifejezései is bekerüinek 
a modellbe. Ez nem meglepő, hiszen a többváltozós függvények sorbafejtésénél is 
ilyen kifejezések írják le a függvény hatványsorát. Ez egyszerűbb esetben a több- 
változós lineáris és az egyváltozós polinomiális regresszió kombinációjaként fogható 
fel. Tekintsük például a következő modelleket 


Y — apa .Xt a, X?t asz, 
Y — apa X13-a 721 a, XxZ, 
Y — a,-- a1(1/X)-- a, log X3- a, Z. 


Az első esetben a többváltozós lineáris regressziót X.—X, X,—X?, X,.—Z he- 
lyettesítéssel használhatjuk. A második esetben a megfelelő helyettesítések felírását 
az Olvasóra bízzuk. Megjegyezzük, hogy az XZ kifejezés két független változó 
kölcsönhatását fejezi ki. A harmadik esetben X,—1/X, X.—log X, X,—Z helyette- 
sítés vezet célra. Bár log X az X-nek nem hatványa, de ez a módszer alkalmazását 
nem befolyásolja, hiszen ezt a tényt sehol sem használtuk ki. Mivel ez az általános 
eset igen gyakran előfordul, erre külön programot írtunk. A program még arra is 
lehetőséget ad, hogy a függő változót is transzformáljuk. (Ilyenkor természetesen 
tudatában kell lenni annak, hogy a mérési hibák eloszlását is transzformáljuk !) 

Nézzük a program alkalmazását a 6.3. alfejezetben bemutatott AMMON adatsor 
példáján! Tegyük fel, hogy a legjobban kilógó 21. pont elhagyása mellett döntöt- 
tünk (ennek jogosságáról az Olvasó a mért és az első modellel számított eredmények 
összevetésével meggyőződhet), és a többváltozós kovarianciaanalízisből (I. a 6.5. al- 
fejezetben) azt a következtetést vontuk le, hogy az xs változó hatása az Y-ra nem 
szignifikáns. Helyette az x, négyzetével próbálkozunk. Ha ez a csere a többválto- 
zós korrelációs együtthatót, a determinációs együtthatót és az F-próba értékét nö- 
veli, akkor javítottunk a modellen. Ha a modell illeszkedése javul; akkor a becslés 
szórása is csökkenni fog. 

A REGRESSZIÓSZÁMÍTÁS menüjéből a TÖBBVÁLTOZÓS LINEÁRIS REG- 
RESSZIÓ A VÁLTOZÓK TRANSZFORMÁCIÓJÁVAL ágat választjuk. A prog- 
ram, annak érdekében, hogy több regressziós modell egymást követő vizsgálatát 
lehetővé tegye ugyanarra az adathalmazra, eleve feltételezi, hogy adataink lemezen 
vannak, és a bejelentkezés után mindjárt az adatfile nevét kérdezi. A név megadása 
után a program bekéri az adatlemezt. Az adathalmaz neve jelen esetben AMMON. 
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A név megadása után a program beolvassa az adatokat, kiírja a talált adatcsopor- 
tok számát (21) és a független változók számát (3). 

A programban a független változók jele xo, xi, xs. A függő változó jele Y. A füg- 
getlen változókból legfeljebb 23 aritmetikai kifejezést lehet képezni. Ezek jele 
Kis Xb; tg Xw- 

A kívánt adatcsoportok kihagyását úgy oldja meg a program, hogy az adat- 
pontok közül csak azokra illeszti a függvényt, amelyekre egy, a felhasználó által 
definiálható logikai kifejezés igaz (azaz értéke nem 0). Az Y értéke is transzformál- 
ható, de erre példánkban nincs szükség. Az eredmények a képernyőn automatiku- 
san, külön kérés nélkül megjelennek. 

Esetünkben a megfelelő transzformációk : 


X -X 
í5 — X; 1 
KEX 


A 21., figyelmen kívül hagyandó adatot az különbözteti meg a többitől, hogy ez 
az egyetlen, amelynél az xg értéke (az oxidáló levegőáram mennyisége) 70. Ezért a 
megfelelő logikai kifejezés: x05£70. 

Az Y transzformációjául (és annak inverzéül is) önmagát adjuk meg. Ezzel min- 
den szükséges információt megadtunk a programnak. Megjelenik a képernyőn egy 
OK (I/N) üzenet. Ha az eddigiekben hibát követtünk el valahol, most lehetőségünk 
van javítani. Ha igennel válaszolunk, a program megkérdezi az output file nevét, 
és a számolás elindul. Első lépése az adatválogatás. Ha helyesen írtuk fel a logikai 
kifejezést, éppen azokat a pontokat találja meg, amelyekre a függvényt illeszteni 
akartuk, esetünkben az első 20 pontot. A program a képernyőre kiírja a talált pon- 
tok számát, a program és az adatfile nevét, és a regressziós függvényt a becsült 
konstansokkal: 


Y — —14,51457-0,77375X, —2,321X, 3-0,07625X, X1 


A regressziós táblázat esetünkben a következőképpen alakul: 


B sé Négyzetösszeg 
Négyzetösszeg Szab. fok száb. fok 

Regressziós 1955,5 3 651,8 
Maradék 1071 16 6,7 
Teljes 2062,5 19 

F-érték 97,4126 
Determinációs koefficiens 0,9481 
Korrelációs koefficiens 0,9737 
A becslés standard deviációja 2,5868 


KÉR PONTONKÉNTI ELLENŐRZÉST? ([/N) 
Természetesen kérünk. Válaszképpen valamennyi mérési pont sorszáma, mért és 
számított Y értéke és a kettő eltérése jelenik meg a képernyőn: 
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Sorszám Mért tött " Eltérés 
1 42 40 3 
2 37 40 —3 
3 37 33 4 
4" 28 22 6 
5 18 19 —1 
6 18 20 —2 
7 19 22 —3 
8 20 02 —-2 
9 15 17 -2 
10 14 13 1 
11 14 13 1 
12 13 13 0 
13 11 13 —-2 
14 12 14 -2 
15 8 7 1 
16 7 7 [0 
17 8 8 0 
18 8 8 0 
19 9 8 1 
20 15 13 A 


Átlagos eltérés — 2,54 


Összehasonlítva az eredeti többváltozós lineáris regresszióval kapott eredmények- 
kel (6.3. alfejezet), kitűnik, hogy bár ugyanannyi együtthatót tartalmazó egyenlettel 
közelítettük az összefüggést, az F-érték mégis 58-ról 97-re nőtt, azaz jelentős javulást 
értünk el. Hasonlóképpen nőtt a determinációs és korrelációs együtthatók értéke is: 
a becslő függvény a vizsgált független változó tartományban az Y változásának 
közel 959-át visszavezeti az X változók adott függvény szerinti változására. 

A program ezután újabb számítás lehetőségét ajánlja fel. Most meg lehet változ- 
tatni a függvény alakját, a pontok kihagyására felírt logikai kifejezést, stb. Ezt az 
eljárást addig érdemes ismételni, amíg az F-érték javítható. (Gondoljuk meg ugyanis 
a következőket: Ha a pontok közül egyet sem hagyunk el, akkor a teljes négyzet- 
összeg állandó. Ezt bontjuk fel két független négyzetösszegre, 01-re és 09-re. Min- 
den kiírt statisztikai mérőszám ebből a két négyzetösszegből származtatható. Mivel 
a kettő összege konstans, az egyik csak úgy nőhet, ha a másik egyidejűleg csökken, 
így hányadosuk a legérzékenyebb mutatója minden változásnak. Másrészt ha F-értéke 
nő, akkor a determinációs és korrelációs együtthatók értéke is nő, a becslés szórása 
pedig csökken. Ezek nem független információk, így csak akkor kell értékükre 
újra figyelni, ha a regressziós számításba bevont pontok körét megváltoztatjuk.) 


EGYVÁLTOZÓS POLINOM ILLESZTÉSE 


A változók listája: 


N — mérési pontok száma, 

M — polinom fokszáma, 

X(D — független változó vektora, 

YD — függő változó vektora, 

OX, OY — függő és független változó mátrixbeli oszlopszáma (lemezről történő 
adatbeolvasásnál használjuk), 

e — a polinom együtthatói 


(Y—0(0)1-O(1) XX-4.000) XX... 4OCM) x. XM), 
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S5 — determinációs együttható, 
56: — korrelációs együttható, 
S7 :, — a becslés szórása. 


Programmagyarázat: 


100: Programcsomag-szervezés. 
110—250: A program neve. 
260—720: Adatbevitel. 
730: A polinom fokszámának megadása. 
740—750: A polinom fokszámának ellenőrzése. 
760—1000: A regressziós függvény együtthatóinak meghatározása. 
1010—1030: Az eredmény kiírási helyének kijelölése. 
1040—1170: Az együtthatók kiírása. 
1180—1560: A regressziós táblázat számítása. 
1570—1730: A mérési pontok ellenőrzése. 
1740—1910: Pontok meghatározása a regressziós görbéből. 
1920: Visszatérés a FŐMENÜ c. programhoz. 
1930—2340:  Adatbeolvasás lemezről. 
2350—2460:  Lemezhiba-ellenőrzés. 
2470—2620: A program által nyújtott lehetőségek rövid ismertetése. 
2630—2810: Várakozás Igen-Nem válaszra. 


IMPUT"H PÜLIMÖM FOKSZAMR": HM 
7. HEZINTÉM: OR Hi THEM PRIHTSA Fi 


:GüTü 7 
1": GÜTÜ 7 


szak 


FOR TsA TŰ M:IF Ik 
tz-EKT,89:FOR JAZ41 TŰ ML: 
ij 


a 
BG 1p Te "5 THEM 155A 
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TÖBBVÁLTOZÓS LINEÁRIS REGRESSZIÓ A VÁLTOZÓK 


TRANSZFORMÁCIÓJÁVAL 


Fontosabb változók listája: 


N$ ES 
NO vas 
MO se 
BXCI,J)  — 
X(N0O, 27) — 
B (27) sz 
R(4,3)  — 
X0, ..., X9 — 
"SZ sm 


A (27, 27) 


az input adatfile neve, 

az input adatmátrix sorai száma (mérési pontok száma), 

az input adatmátrix oszlopainak száma (független változók száma), 
input adatmátrix, 

a regressziószámításnál figyelembe veendő adatok mátrixa, 

a közelítő függvény együtthatóinak vektora, 

regressziós adatok, 

egy adatsor független változói, 

egy adatsor függő változója, 

az együttható mátrix a Gauss-—Jordan eljárásban. 


Programmagyarázat : 


100: 
110: 
120: 
130—150: 
160—170: 
180—470: 
180—190: 
200—-460: 
470: 
480—530: 
540—1180: 
540—880: 
890—1060: 
1070—1180: 
1190—1240: 
1250—1640: 


1650—1700: 


1710—2000: 
2010—2120: 
2130—2140: 
2150—2250: 
2140—2300: 
2250—-2390: 
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Programcsomag-szervezés. 

Szubrutin : felhasználói függvények létrehozása. 

Szubrutin : felhasználói függvények hívása. 

Szubrutin : x. felhasználói függvény keresése a memóriában. 
Szubrutin : felhasználói függvény cím változtatás a memóriában. 
Szubrutin : felhasználói függvények megadása. 

x. Y kiírása és a függvény képletének inputja. 

A függvény , tokenizálása". 

Az átalakított képlet elhelyezése az ideiglenes tárolóterületen. 
Szétugrató tábla. 

Szubrutin : m változós lineáris regressziószámítás n adatsor alapján. 
Belépéskor az x(n, m--1) mátrix tartalmazza az adatsorokat. Ki- 
lépéskor a b(m--1) vektor tartalmazza a közelítő függvény együtt- 
hatóit, r(4, 3) a regressziós adatokat. 

A megoldandó lineáris egyenletrendszer mátrixának kialakítása. 

A lineáris egyenletrendszer megoldása Gaussz—Jordan módszerrel, 
szükség esetén oszlopcserékkel. 

A regresszió jellemző adatainak kiszámítása. 

Szubrutin : behelyettesítés a közelítő tüggvénybe. 

Szubrutin : az eredmények kiírása. 

Szubrutin : kiírás a képernyőre. 

-3- megszakítási kérés figyelés (megszakítás a COMMODORE gomb- 
bal lehetséges). 

Szubrutin : kerekítés. Az x szám ee egész jegyet és dd tizedesjegyet 
tartalmazó kiírási képe lesz kilépéskor az x$ változóban (hossza 
€e1t-dd--2 mindig). 

Indulási képernyő. 

Az adatfile nevének bekérése. 

A kiírási képek megadása. 

Adatmátrix beolvasás és megjelenítés a képernyőn. 

Használati utasítás. 


2400—2530: 
2540—2710: 
2720: 

. 2730—2740: 
2750: 
2760—3070: 
3080—3220: 


ca lát 
Z FEINTZERINT SZÁJA MEG AZ v TRRI 


a PRINT:FRIHT9ZHIJH HEG He 9 TRA 
ü L$z"H":IHPUTYOK ZI/M: 
IHPUT"KEPERMYOK 3 
IF ACZ3 AHU AZA 


A változók transzformálására szolgáló függvények és a figyelembe 
veendő adatsorokat leíró logikai kifejezés bekérése. 

A megadott feltételnek eleget tevő pontok kiválogatása, megjelení- 
tése a képernyőn és elhelyezése az x( ) mátrixban. 

Szubrutinhívások : regressziószámítás és az eredmények kiírása. 
Újabb számítás? Igen válasz esetén vissza a felhasználói függvények 
megadásához. 

A program vége. 

Az adatok bevitele. 

Lemezhiba-ellenőrzés. 


PRINT"H PRUGRAMBERAM A FUGGETLEN VAL" rozú k sa E":FRIHT"AO" ; 
IFMUD1THEMFORI-ÍTOME- 1 : PRIHT , 8 

PRIHT".":FRINT"R FUGGU VALTOZÓ .I 
FRIMHT"A FUBGETLEM VALTOZOKEBOL L 8 B, s 
FRIHT"ARITMETIKAI KIFEJEZEST LEHET KIHL. 
PRINT"ES AZ ÜSSZEFUGGEST EZEK LIMERAR 
PRINT"HACIOJAVAL KÖZELITEMI. -IEL 7] 
PRINT"AZ ADATPONTOK KÖZÜL CSAK HZOKRA "ILLE 
PRIMT"TUNK. FUGGYENYT, FAMELYEKRE A MEGHIUÜTT 
PRINT"LOGIKAL KIFEJEZES IGAZ (VAGYIS, HEM 
FRINT"AZ Y ERTEK 15 TRAH: 
ti PRINT"ÉRTEK .JE 
FRIHT"H TRAMSZFORMACIÓ IHVERZ FI 
PRIMT"IS MEG KELL AIHMHI.: JELE 
PRINT"AZ EREDMEHNTEK: 


5415: :HEZT 


ORHALHATO: AZ LT! 
JEMYET" 

Zs 
Í IZ HYOMTATHATOK. " 


ELE Tu 


A vágzNtog te uez ya: ezezn ey 
FRINT: PRINT ADJA HEG H KÍFEJEZESEKET! fyEBESÜRES?" 
a CIs4d915z:.J-Ű 


at: IFeagz "s  THEMME I: GÜTÖZ4 ER 


$:FRINT"ZHUTH MEG AZ ; 


, LÜGIKRAI KIFE. 
FOMACIOJHAT I" 


IT INYVERZET!": J-z5: GOSUR1EW 
"I"THEMZ4iHi 


JE MEKI" ; L£:IFL 
29 "HVOMTATÓ dat: Hi 
18 


"THEH 


aki DFPEMZ, 4: Izz 


B Táz FALÁT VÁLOGAT TAB":G 
ÜNMEGOTÓ ú 
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6.5. Korrelációs mátrix számítása 


A korrelációs együttható fogalmával a regressziós egyenes statisztikai vizsgálata 
kapcsán már megismerkedtünk. Az ott elmondottakat két valószínűségi változó 
összefüggésének vizsgálatára alkalmaztuk. Ha többváltozós problémát vizsgálunk 
(pl. a többváltozós lineáris regressziós egyenlet illesztésekor), akkor ez az össze- 
függésvizsgálat minden lehetséges változópárral kapcsolatban elvégezhető. Ha 3 
független változót tartalmaz egyenletünk, akkor vizsgálható az X1—Xo, az X9.— X5, 
az X.—X;, az 4Xo—Xz, az Y—X,, Y—X, ésaz Y— Xs összefüggése, pontosab- 
ban együttváltozása, korrelációja. Ha a változókra vonatkozó mérési adatokat táb- 
lázatos formába (mátrix alakba) rendezzük, ebből a táblázatból a lehetséges vál- 
tozópárosításoknak megfelelő korrelációs együtthatók ugyancsak táblázatos alak- 
ban egyszerű vektoralgebrai műveletekkel előállíthatók. Az így kapott táblázat neve: 
korrelációs mátrix. 

Emlékezzünk rá: a korrelációs együttható tulajdonképpen a két változó kovarian- 
ciájának és a két változó szórásai szorzatának hányadosa. (Vektoralgebrai értelem- 
ben n mérési pont esetén a korrelációs együttható éppen a két n dimenziós vektor 
által bezárt szög koszinusza.) Egyetlen változó saját magával vett kovarianciája a 
variancia, azaz a szórásnégyzet. Így a korrelációt egyetlen változóra kiszámítva mind 
a számlálóban, mind a nevezőben X ugyanaz a variancia áll. Ezért bármely változó 
önmagával vett korrelációja 1. (Vö.: bármely vektor önmagával párhuzamos, így 
bezárt szögük 09.) 

A korrelációs mátrix szimmetrikus. Ez nyilvánvaló, ha meggondoljuk, hogy az 
X.—-X. pár korrelációja nem függhet a változók sorrendjének megválasztásától. 
Vezessük be Y helyett az általánosság kedvéért az X,..1 jelölést. Ezekkel a jelölések- 
kel azt mondhatjuk, hogy a korrelációs mátrix olyan szimmetrikus (71--1) : (n-t1)-es 
mátrix, 


— amelynek i-edik sorában a j. oszlopban az X; és X; változók korrelációs ko- 
efficiense áll; 

— a mátrix főátlójában csupa 1-es áll; 

— a mátrix elemei legfeljebb 1 értékűek. 

Miért fontos számunkra a többváltozós regressziószámításban a korrelációs mátrix 

ismerete? Tulajdonképpen azért, mert ezzel eldönthetjük, hogy mely változókat kell 

a modellben figyelembe venni, ill. mi a változók közötti , erősorrend" a függő vál- 

tozóra gyakorolt befolyás tekintetében. A modell , javításakor"?" a gyengébb hatású 

változókat megkísérelhetjük elhagyni, esetleg a korrelációszámítás szerint erősebb 

hatású változók kifejezéseivel helyettesíteni. A korrelációs mátrix alakja tehát a 

következő : 


1 Fo xe Tsaxz tt Txaxn 0 Txaxnai 
Vxa xi 1 Txoxs — Txaxn  Txaxnai 


Fona1xi Vxen41x2 Foo 41X8 Fena1xn 1 


Az elmondottak megvilágítására tekintsünk ismét egy példát! Számítsuk ki a 6.2. al- 
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fejezetben ismertetett salétromsavgyári véggáztisztító üzem adataira a korrelációs mát- 
gixot. Adatainkat az AMMON file-ból vesszük, amelyet mágneslemezen tároltunk. 
Először behívjuk a REGRESSZIÓSZÁMÍTÁS menüjéből a KORRELÁCIÓS 
MÁTRIX SZÁMÍTÁSA alprogramot. Erről kérhetünk ismertetést vagy anélkül is 
továbbmehetünk. Mivel adataink az AMMON file-ban vannak, értelemszerűen vála- 
szolunk I-t az , adatok lemezen vannak vagy billentyűzetről akarjuk bevinni (I/N)" 
kérdésre, megadjuk az adatfile nevét és betesszük az adatlemezt. A program az 
adatokat beolvassa, majd megkérdezi, hogy kívánjuk-e az adatokat képernyőn meg- 
jeleníteni. Ha nemmel válaszolunk, vagy ezen az ágon végighaladva már megtekin- 
tettük adatainkat, a program megkérdezi, hová írja az eredményeket. Az eredményül 
kapott korrelációs mátrix a következő lesz : 


1 0,78185 0,50014 091966 
0,78185 1 0,39093 0,87550 
0,50014 0,39093 1 0,39982 


091966 0,87550 039982 1 


A mátrixból látható, hogy az F-nal a leggyengébben korrelált változó X5 volt. 
Ezért hagytuk ki az előző fejezetben éppen ezt a változót a modellből. Választásunkat 
a korrelációszámítás alátámasztja. 


KORRELÁCIÓS MÁTRIX SZÁMÍTÁSA 


A változók listája: 


N — mérési pontok száma (max. 100), 
M — független változók száma (max. 10), 
X(I,J) — független változók mátrixa (K—1-től N-ig, L—1-től M-ig megy), 
R(I,J) — a korrelációs koefficiensek mátrixa, 
N$ — az adatfile neve. 
Programmagyarázat : 
100: Programcsomag-szervezés. 


110—230: A program neve. 

240—780: Adatbevitel. 

790—1020: A rpKkorrelációs mátrix számítása. 

1030—1050: Az eredmény kiírási helyének kijelölése. 
1060—1340: Az eredmények kiírása. 
1350: Visszatérés a FŐMENÜ c. programhoz. 
1360—1690:  Adatbeolvasás lemezről. 
1700—1810:  Lemezhiba-ellenőrzés. 
1820—1980: A program által nyújtott lehetőségek rövid ismertetése. 
1990—2170: Várakozás Igen-Nem válaszra. 
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7. AZ ADATKEZELŐ PROGRAM 


Az előző fejezetekben ismertetett statisztikai programokkal általában igen sok ada- 
tot dolgozunk fel egyszerre. Nagyobb adathalmazok feldolgozásánál mindenképpen 
szükség van háttértárolóra. Így elkerülhetjük az adatok esetenkénti újragépelését. 
Ebben a fejezetben adatkezelő programunk telepítését és működését ismertetjük. 

Egy adatkezelő programmal szemben általában a következő elvárásaink vannak: 
a program tetszőleges adatmátrixot tudjon beolvasni a billentyűzetről, és azt tárolni 
tudja lemezen. A program tegye lehetővé a hibás adatok javítását. Adjon lehetőséget 
az adatállomány bővítésére, ill. a fölöslegessé vált adatok törlésére az adathalmaz- 
ból. Fontos funkciója továbbá az adatok megjelenítése, kiírása képernyőre vagy 
kinyomtatása papírra. 

Nézzük meg, hogyan működik adatkezelő programunk! A főmenüből válasszuk 
az ADATFILE MŰVELETEK című programot! A program az előző programok- 
nál már megszokott KÉR ISMERTETÉST kérdéssel jelentkezik be. Ha igent vála- 
szolunk, akkor megjelenik a képernyőn egy rövid ismertetés a program működéséről. 
Ha nem kérünk ismertetést, akkor az adatkezelő program főmenüje jelenik meg a 
képernyőn. Ez a következő lehetőségek közül enged választani: 


ÚJ ADATHALMAZT AKAR LÉTREHOZNI (U) 
RÉGI ADATHALMAZZAL DOLGOZIK (R) 
VÉGE (V) 


Nézzük soronként ezeket a lehetőségeket! 


Ha még nincs kész az adathalmazunk, hanem most szeretnénk létrehozni, akkor 
természetesen az U billentyűt kell lenyomnunk. Ennek hatására a program meg- 
kérdezi a létrehozandó adathalmaz nevét és a független változók számát. A független 
változók száma az adatmátrix oszlopainak számánál eggyel kevesebb, az utolsó 
oszlopba a függő változót helyezi el a program. Az adatmátrix sorainak száma az 
adatcsoportok számával lesz egyenlő. (Figyeljünk az elnevezésre. Az adathalmaz 
adatcsoportokból áll, egy-egy adatcsoport összefüggő (egy méréshez tartozó) ada- 
tokat tartalmaz. Annyi adatcsoportból áll tehát az adathalmaz, ahány független 
mérési pont adatait tartalmazza.) 


Ezután a következő almenü jelenik meg a képernyőn: 


ÚJ ADATCSOPORT MEGADÁSA (U) 
RÉGI ADATCSOPORT KIÍRÁSA — (K) 
RÉGI ADATCSOPORT MÓDOSÍTÁSA (M) 
RÉGI ADATCSOPORT TÖRLÉSE (T) 
ADATMÁTRIX KIÍRÁSA (A) 
FELVÉTEL (F) 


VÉGE (V) 
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Újabb U választásra a program bekéri az első adatcsoport független és függő 
változóinak értékeit. AZ értékek begépelése után felteszi a program a kérdést, JÓK 
AZ ADA1OK ? leenlő válasz esetén visszatér az almenü elejére, ahol folytathatjuk 
ugyanazon adathalmaz következő adatcsoportjának megadását. Ha az adatok gépe- 
lése közben hibát vétettünk, akkor lehetőségünk van a hibás adatok javítására. 
Ezzel a módszerrel tehát a kívánt adathalmazt létrehozhatjuk. 

Az adathalmaz létrehozása után azt nyilván szeretnénk lemezen is megőrizni, 
hisz éppen az a célunk, hogy ne kelljen minden egyes feldolgozáshoz az adatokat 
újra begépelnünk. Az adathalmaz lemezre vételéhez az almenüből a EELVÉTEL 
ágat kell választani. Az F billentyű lenyomására a program bekéri az adathalmaz 
nevét, ami lehet az előzőekben megadott, ill. itt még módunk van más nevet vá- 
lasztani. 

Megjegyezzük, hogy az adatokat célszerű külön lemezen tárolni. Lemezkezcelés 
közben számtalan hiba léphet lel, amire egy adatkezelő programot fel kell készíteni. 
Elképzelhető például, hogy formálatlan lemezt helyezünk be az egységbe adatlemez- 
ként, vagy a lemezünkön volt már olyan nevű adathalmaz, amit most megadtunk. 
Az ilyen típusú hibáknál a lemezegység piros lámpája viilogni kezd. A lemezhibák 
programbeli kezelését a hibacsatorna segítségével végezzük. A hibacsaiornán ke- 
resztül kiolvashatjuk a hiba számát és a hibaüzenetet, így a program működését ettől 
függően folytathatjuk. 

Sikeres lelvétel után a program az almenüre tér vissza, ahonnan — ha munkánk 
ezzel véget ért — a V billentyű lenyomásával léphetünk ki. 

Nézzük ezután az almenü következő pontját A RÉGI ADATCSOPOR1 KI- 
ÍRÁSA-t! Erre a K betű lenyomásával van lehetőségünk. Az előzőekben bevitt 
adatcsoport, ill. adatcsoportok már meglevőnek, azaz réginek tekinthetők. Ha egy 
régi adatcsoport kiírásánál rájövünk, hogy az ott szereplő értékek nem helyesek 
(hibásan írtuk be azokat vagy időközben megváltoztak), akkor az M billentyű le- 
nyomásával a RÉGI ADAITCSOPFORT MÓDOSÍTÁSA programrészt aktivizálhat- 
juk. Ez a programrész az ADATCSOPORT SZÁMA? kérdéssel jelentkezik be. 
Itt kell megadnunk annak az adatcsoportnak a sorszámát, amit módosítani szeret- 
nénk. Ha nem emlékszünk rá, hogy hányadik adatcsorortról van szó, akkor az 
adathalmaz kiírásával ezt megtudhatjuk. A javítandó adatcsoport számának be- 
gépelése után az értékek megjelennek a képernyőn, mégpedig úgy, hogy a kurzor 
villogása jelzi az éppen javítható értéket. Így a javítást, ilI. módosítást igen könnyen 
elvégezhetjük. Előfordulhat az is, hogy egy egész adatcsoportot törölni szeretnénk. 
Ezt az almenü ADAICSOPORT 1ÖRLÉSE programággal a 1 billentyű lenyomásá- 
val kezdeményezhetjük. 

Nézzük végül az almenü utolsó, de igen fontos lehetőségét, a teljes adathalmaz 
kiírását! Az A billentyű lenyomásával az ADAT MÁTRIX KIÍRÁSA programrész 
lép működésbe. A programrész a KÉPERNYŐ (3), PRINTER (4)? kérdéssel jelent- 
kezik. Itt választhatjuk tehát ki az output perifériát. Ha csak azért íratjuk ki az 
adathalmazt, hogy szemünkkel átfutva gyorsan ellenőrizzünk valamit, akkor cle- 
gendő a képernyőre kiírás. Ha szeretnénk listán is megőrizni az adatokat, akkor a 
nyomtatót kell választanunk. 

A főmenü második ágának választása a RÉGI ADATHALMAZZAL DOLGO- 
ZIK ág első tevékenysége egy lemezen már meglevő adathalmaz beolvasását teszi 
lehetővé. Az R billentyű lenyomása után az ADAIHALMAZ NEVE kérdés jelenik 
meg a képernyőn. Itt kell megadnunk tehát annak az adathalmaznak a nevét, amivel 
a továbbiakban dolgozni szeretnénk. Ezután a IEGYE BE AZ ADAT LEMEZT ÉS 
NYOMJON MEG EGY BILLENTYŰT! parancs kerül kiírásra. A szóköz billentyű 
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lenyomásának hatására megkezdődik az adott nevű adathalmaz beolvasása a lemez- 
ről a memóriába. Ezt a műveletet addig kell folytatni, amíg az utolsó adatot is be- 
olvastuk. Az utolsó adat elérését az SI rendszerváltozó értéke jelzi, amelynek tar- 
talmát a lemezegység cperációs rendszere minden beolvasási lépésben módosítja. 
A file utolsó adatának beolvasásakor az ST rendszerváltozó értéke 64. Így a beolvasó 
ciklust az ST—64 vizsgálattal vezérelhetjük. 

Ezek után a már beolvasott adathalmazzal az almenüben szereplő, az előzőekben 
bemutatott műveleteket végezhetjük. Az adatkezelő programból a teljes kilépést 
a V billentyű lenyomásával, a VÉGE funkció aktivizálásával érhetjük el. 


ADATKEZELŐ PROGRAM 


A változók listája: 


N — mérési pontok száma, 
M — független változók száma, 
X(I,. JD. — a függő és független változók mátrixa (7/—1-től N-ig, J—1-től M--1-ig 
megy), 
N$ — az adatfile neve. 
Programmagyarázat: 
100: Programcsomag-szervezés. 


110—230: A program neve. 
240—470: Főmenit. 
480—500: Független változók számának megadása. 
510—540: Alprogramok hívása. 
550—760: Adatbceolvasás. 
7710—960: Adatfelvétel. 
970—1270:  Almenük felsorolása, vezérlésátadás a különböző almenüknek. 
1280—1500: Uj adatcsoport megadása. 
1610—1790: Régi adatcsoport kiírása. 
1800—-1860: Régi adatcsoport módosítása. 
1870—2040: Régi adatcsoport törlése. 
2050—2190:  Lemezhiba ellenőrzése. 
2200—2360:  Adatcsoport kiírása. 
2370—2640:  Adathalmaz kiírása. 
2650—2880: A program által nyújtott lehetőségek rövid ismertetése. 
2890—3030: Várakozás Igen-Nem válaszra. 
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1788 GOSUE 297A:ER-1 
"1798 RETIJRM 
1808 BEM BERKKEK krt 


19826 REN REGI ADATCSÚFORT HANOSITASÁK 
1838 REM$ 
1848 REMEEREKEKEREREÉKEREEKEERE ENE EE EKE 
1858 GOSUFB ií728:IFE THEM RETURH 
1868 GOSUB z25ü:6G 248: RETLIRN 
EREKESEERE EK EK 


1870 REMKNEÉEESEEK 

1838 REM: 

1899 REM$ REGI ADATCSÓPORT TORLESE há 

1989 REM$K j e 

1918 REMESEREEKEK EE E EE EE EE KER EEEE E EK 
GOSUJE 1728 

1994 IF E-R-1 THEN RETLEHM 

1948 PRINT"BIZTOS:. HOGY TŰRÖLILK" 

1959 GOSUE 32819 

1989 IF A$z"M" THEM RETLIRN 

1978 IF R-NM THEN 29309 

19830 F(R TsR TO M-1 

1990 :FOR JI5si TŰ M4$i 

2B06 ::ACI,JISACIH1, JA 

2019 :MHEXT .J 

2a29 HEAT I 

2838 M-M-1 


2948 RETURM 
2959 Eo áááölájtlábálákááábásáláklsk félsz ll 
2860 Mik 
2878 REM LEMEZHIRA ELLEHÜRZESE h 


2888 REMK w 
rdskelal REPétetet dette tetátteküet sájjjááüdss bók li 
z2z168 IMPUTRIS.HS 

2119 IF HS-A THEH RETURH 7 
zíi2zA PRIHT 

2138 FRIMT"LEMEZHIBA! ":PRIHT 

214 PRIHT HS;HHE: 5; SZ 

2159 PRINT 

z1E9 GOSLE 2339:RETURH 

2176 PRINT"HYOMJA MEG A MEGFELELŐ GOMEOT!" 
2199 ÖETRS$: IFA$-""THEMHZ1SS 

aA RETURH 

ee bágásásásák áá ásákááltá óne al la UR dei 


"ADATHALHE 


226 eIMHT 

a278 FRINT"AHATCSOPORT: "MIR 
2288 FRINT 

2298 IFM-6 THEM2348 

2396 FOR J5s1 TO OM 


He: 
.147 d; 
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"2316 PRIHT "ZE"SMITNELETREC II. 29 "9" TAROTÍ sás "AC RJ 
2328 NEXTJ 
2z33ú FEINMT 
2348 FRIHT"WY"GTREC75:"z "AC R.ME1t 
23598 IF BECZYM" THEN GÜSUR A 
2567 RETURM 
2278 REMEKEEEREREEEEEE 
23929 REMK HANIATFILE HE 
23398 REMHESEEKREREN KEK RE w 
24089 A$z! o :PRIHT"AZ ADATHALMAZ Mi ? ":H$:LEFTÉGYI§,LENCH$tHE? 
2418 IMPUT A£:IF M£-"" AHD A§z!" THEN z4mA 
zdza HEsA$: RETLIRH 
2420 REMEKEREKEKREEEETEKEE EE kelet toket 
2448 REMK hd 
2450 REMt ADATHALMAZ KIIRASH X 
24E£0 REMEK k 
Z247A REMEREEEEEKKK I BEREEEEEEEEHEK E 
z4Za PRIHT 
2498 IMFUT"KEPERNYOCS3. PRIHTERC42 "5 ID 
2508 IF IDC3 AND IH£(54 THEM 243908 
2518 ÖFEMID,ID:SMHz6:IF ID-3 THEM PRIHT CHRÉ(C1472::SMs3 
2529 PRIHTHID. "ALATMATRIA :":HE 
zsz6 PRIMT$ID:LM-Z:IF M-ü THEH 2638 
2548 FOR I51i1 TÜN 
255a PRIMTHID.RIGHTE(" VAS TRECI3, 745: §5H 
FOR J-1 TO M4i 
PRINTHID.RIGHT$(" "ZTE 
SzS41:IF Z5SM AMIN JIJZSM4tIi THEM PRINTHIDN 
1 HET J 
a FRINTHID:LM5LM-41 ú p 
IF ID-3 ANDI LMAINT(CM419 "25028 AMI JICSM THENGOSÚÍEZSZA:LNsá:FRINT CHRE(idv a 
MHEXZT 
2638 CLOSE IM:GÜSUB 2558 
a RETLIRM 

REMEXEEKEKETSEEREEEE KEREKE EE EHE 
REM: b 
aláb ISMERTETES Had 

ME 


k 
REMEREREH ÉRE L EE EE RE E E EEEEE 
PRIMHT CHRE(147) 
PRINT"ANATKEZELO PROGRAM" 
PRTBHT öeeszszzzmegt ozni setzistesésétészszsztsájee 
PRIHT"A PROGRAM AZ ALABBI FELADATUK VEGZESERE ALKALMAS: 
UJ ADATHALMAZ LETREHt 
ALATHAL.HAZ FELYETEL 
REGI ADATHALHAZ BETÜLTI 

LEMEZRŐL" 


KI.J Vg i21i 
PRIHTHIDN," 37: SzA:LN5SLM41 


AIATHAL HAZ MHŰNOZITHSA" 

ADATHALMAZ BRÜYIT b 

ADATCSOFORT  TÖRLESE AZ RIIRT" 
HALHAZEOL" 


ATATHALMAZ KEPERHÍr ts IRASH" 
H 2 F 


A REMEK kedély: 
3 PRIHT:FRIHT"T 
1 PRINT:PRIHT"NYO J 
FÜR. TE Ta 1 


"sa 
SZERTHÁT SET sz 


vu; A j 
ANN AECS"H" THEM 36168 


j IF APCSNIS 
i RETURH 
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MELLÉKLET 


1. táblázat 


A normális eloszlás kritikus értékei (u) 


,01 503 ,05 ,07 509 
0,0 55040 , 5120 , 5199 , 5279 5359 
s] , 5438 Fésjoi Ír ,5596 :JÓ7S 9798 
2 , 5832 5910 ,5987 6064 6141 
fé) ,6217 , 6293 6368 6443 50517 
4 ,6591 6664 6736 , 6808 ,6879 
9 , 6950 , 7019 , 7088 s ZA37 , 7224 
,6 s: 7221 s Zadl , 7422 , 7486 , 7549 
BV 57611 ,7673 ,7734 a 7498 , 7852 
8 , 7910 , 7967 , 8023 , 8078 8133 
9? 8186 , 8238 , 8289 8340 , 8389 
10 8438 , 8485 ,8531 8577 , 8621 
1,1 8665 8708 , 8749 8790 8830 
ÍZ , 8869 , 8906 , 8943 , 8980 ,9015 
1,3 9049 9082 9115 59147 JÁT 
1,4 9207 9236 9265 9292 9319 
1,5 9345 59370 ,9394 9418 9441 
1,6 9463 9484 9505 9525 9545 
Hő 9564 ,9582 9599 9616 9633 
1,8 9648 9664 9678 9693 9706 
1,9 9719 59732 ,9744 9756 ,9767 
20 9778 9788 9798 9808 9817 
2.1 9826 ,9834 9842 9850 9857 
2.2 9864 ,9871 9878 9884 9890 
20 ,9896 9901 9906 ,9911 9916 
2,4 ,9920 9924 ,9929 9932 9936 
253 ,9940 ,9943 9946 9949 ,9952 
2,6 59955 9957 9960 9962 ,.9964 
27 9966 ,9968 ,9970 9972 9974 
2,8 9975 9977 ,9978 , 9979 ,9981 
29 9982 ,9983 ,9984 9985 9986 
3,0 9987 ,9988 9989 9989 9990 
352 ,9993 ,9994 ,9994 9995 ,9995 
3,4 9997 9997 9997 ,9997 ,9998 
3,6 ,9998 , 9999 ,9999 9999 9999 
Up 
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2. táblázat 


A Student eloszlás kritikus értékei (z., s) 


É 510 505 ,025 ,01 005 001 
fS to, , 
£ 3,078 6,314 12,706 31.621 63,657 318,310 
2 1,886 2,920 4303 6,965 9925 SZO Á 
3 1,638 25353 3,182 4,541 5,841 10,215 
4 1.533 25132 2,776 3,747 4,604 7.178 
5 1,476 2,015 25971 3,365 4,032 5,893 
6 1,440 1,943 2,447 3,143 3,707 5,208 
HÁ 1,415 1,895 2,365 2,998 3,499 4,785 
8 1.397 1,860 2,306 2,896 35995 4,501 
9 1,383 1,833 2,262 2,821 3,250 4,297 
10 1372 1,812 2,228 2,764 3,169 4,144 
15 1,341 1753 2.131 2,602 2947 3/3939 
20 1.325 1.725 2,086 2,528 2,845 3.952 
30 1,310 1,697 2,042 2,457 2,750 3,385 
40 1,303 1,684 2,021 2,423 2,704 3,307 
60 1,296 1,671 2,000 2,390 2,660 3.232 
120 1,289 1,658 1,980 2,358 2,617 3,160 
00 1,282 1,645 1,960 2,326 2.576 3,090 
w € 
ji 
ter 
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A 2? eloszlás kritikus értékei g8, 


3. táblázat 


€ 5995 599 3975 595 ,50 s20 10 05 ,025 01 ,005 
Tf Jözai 
1 0,000 — 0,0002 0,001  0,0039 045 1,64 2.11 3,84 3,02 6,63 7,88 
2 0,010 09020 0,051  0,103 1,39 3.22 4,61 5.99 7,38 9,21  10,60 
38 0,072 0O,IIS 0216 0,352 ZA 4,64 6.25 781 9,35 11,34 12984 
4 0,207  0,30 0,484 071 3536 3599 75768 9,49 11,14 13,28 14.86 
5] 0412 0O,S5S 0,831 1,15 4,35 729 9.24 11,07 12983 15,09 16,75 
6 0,676  0,87 1,24 1,64 5580 8,56 10964 12,59 1445 1681 18,55 
7 0,989  1,24 1,69 217 6.35 9.80 12,02 14,07 1601 18.48  20,28 
8 1,34 1,65 2,18 210 7.34 11,03 13.36 15.51 17,53 2009 21,95 
9 173 2,09 2,70 3.33 8,34 12.24 1468 1692 19,02 21,67 23,59 
10 2,16 2,56 3525 3,94 9,34 1344 1599 18,31 2048 23,21 25,19 
15 4,60 5.23 6,26 7526 1434 19,31 2231 25,900 27,49 30,58 32,80 
20 7,43 8,26 9,59 10,85 1934 25,04 2841 3141 34,17 37,57  40,00 
25 10,52 11,52 13,12 14,61 24,34 3068 34,38 37,65 40,65 4431 4693 
30 13,79 1495 16,79 18.49 29,34 36.25 40.26 43,77 4698 50,89 53,67 
40 20,71 22,16 2443 26,51 39,34 47.27 51981 55S,76 59,34 63,69  66,77 
50 27,99 29.71 3236 3476 49,33 58.16 63,17 67,50 7141 7615  79,49 
60 35,53 37.48 4048 43,19 5933 6897 7440 7908 8330 8838 91,95 
70 43,28 4544 48,76 51,74 69,33 79,71 85,53 90,53 95,02 100,43 104,2 
80 51,17 5354 57,15  60,39 79,33 9041 96,58 101,88 106,63 112,33 116,3 
90 59,20 61,75 65,65 69,13 89,33 101,05 107,57 113,15 118,14 124,12 128,3 
100 67,33 7006 74,22 7793 99,33 111,67 118,50 12434 129,56 135,81 140,2 
€ 
52 -— 
hg f 
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